学习大数据、云技术如何提高部署学习效率
2015-11-25 23:40
369 查看
转自:http://www.aboutyun.com/thread-14575-1-1.html
1.如何避免反复部署集群?
2.快照的作用是什么?
3.缓存服务器能起到什么作用?
学习大数据、云技术,我们首先应该掌握的是部署,通过部署,我们认识hadoop、openstack等大数据、云技术。
所以部署是我们入门的第一步。
在我们学习的过程中,部署异常是经常遇到的问题,当然如果比较喜欢专研或则非要找出哪里出错了,此文不要适合,本人适合人群,对于错误,无法找到,或则部署混乱,不得不重新部署。这里交给大家,如何最大限度的提高效率。
1.虚拟机快照
来源:
使用虚拟机搭建hadoop、openstack集群必备基础知识:虚拟机快照
我们刚从零基础知识学会搭建集群,学会了Linux知识,学会了Java基础。然后我们开始搭建集群。
搭建hadoop集群
搭建hbase集群
搭建storm
搭建spark集群
在搭建集群的过程中,遇到了各种问题,然后不断的重复开始,不断重复搭建,废了很长时间搭建快要成功的时候,前面都正确安装,但是因为某一个操作,却把环境搞坏了。比如hadoop搭建成功,hbase却失败了。但是又找不出原因。Java环境配置正确了,却因为ssh不成功,然后不断的修改。坏境坏了,该如何办?
如果我们刚开始学习,会不断的重复搭建环境,然后花费大量的时间,在搭建集群上,那么有没有更好的办法。答案是有的,就是----创建虚拟机快照。
那么该具体如何操作:
首先我们看到1处虚拟机,右键弹出右侧菜单,然后看到快照。
3.拍摄快照
点击拍摄快照后,弹出下图,输入名称,快照就做好了。如果后面配置遇到问题,恢复快照即可。
4.恢复到快照
上面做好了快照,这里就可以恢复到某个快照了。
5.快照管理器
单击快照管理,就看到了备份的快照,如果备份了多个就能看到多个。可以恢复到任意一个备份的快照
以上有的朋友可能也知道的,但是合理的使用快照,可以提高搭建集群的效率
2.搭建缓存服务器
这里以ubuntu14.04为例:
源服务器名称可能不太准确,意思是创建内网自己的私服,这样只要有Ubuntu通过该私服下载安装过软件,私服都会缓存,下一个Ubuntu的请求就直接从缓存中获取。
首先安装apt-cacher
apt-get install apt-cacher
复制代码
装的过程中选择Daemon方式。
装完后,/etc/default/apt-cacher 文件内容应该如下:
AUTOSTART=1
复制代码
所以服务应该已经启动了。
到/etc/apt-cacher/apt-cacher.conf文件中修改一行配置,允许任何客户端访问:
allowed_hosts = *
复制代码
重启服务
service apt-cacher restart
复制代码
然后打开网页:http://your_ip:3142/apt-cacher
看到页面就说明服务器正常启动了。
在/etc/hosts文件中添加一行,可以帮助找到chrome依赖的dl.google.com
203.208.45.206 dl.google.com
复制代码
在客户端的ubuntu机器上,创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件
内容如下:
Acquire::http::Proxy "http://your_server:3142";
复制代码
然后运行apt-get update, 为了确认真的起作用。可以查看apt-cacher的日志,到服务器上查看目录下的日志文件
/var/log/apt-cacher
这里以openstack为例:
服务器ip地址为10.0.0.100:
cacher.png (60.75 KB, 下载次数: 0)
下载附件 保存到相册
2015-8-1 18:42 上传
客户端配置:
在客户端的ubuntu机器上,创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件
内容如下:
[Bash shell]
纯文本查看 复制代码
?
然后运行apt-get update, 为了确认真的起作用。可以查看apt-cacher的日志,到服务器上查看目录下的日志文件
/var/log/apt-cacher
监控:
1.png (50.66 KB, 下载次数: 0)
下载附件 保存到相册
2015-8-1 18:45 上传
1.如何避免反复部署集群?
2.快照的作用是什么?
3.缓存服务器能起到什么作用?
学习大数据、云技术,我们首先应该掌握的是部署,通过部署,我们认识hadoop、openstack等大数据、云技术。
所以部署是我们入门的第一步。
在我们学习的过程中,部署异常是经常遇到的问题,当然如果比较喜欢专研或则非要找出哪里出错了,此文不要适合,本人适合人群,对于错误,无法找到,或则部署混乱,不得不重新部署。这里交给大家,如何最大限度的提高效率。
1.虚拟机快照
来源:
使用虚拟机搭建hadoop、openstack集群必备基础知识:虚拟机快照
我们刚从零基础知识学会搭建集群,学会了Linux知识,学会了Java基础。然后我们开始搭建集群。
搭建hadoop集群
搭建hbase集群
搭建storm
搭建spark集群
在搭建集群的过程中,遇到了各种问题,然后不断的重复开始,不断重复搭建,废了很长时间搭建快要成功的时候,前面都正确安装,但是因为某一个操作,却把环境搞坏了。比如hadoop搭建成功,hbase却失败了。但是又找不出原因。Java环境配置正确了,却因为ssh不成功,然后不断的修改。坏境坏了,该如何办?
如果我们刚开始学习,会不断的重复搭建环境,然后花费大量的时间,在搭建集群上,那么有没有更好的办法。答案是有的,就是----创建虚拟机快照。
那么该具体如何操作:
首先我们看到1处虚拟机,右键弹出右侧菜单,然后看到快照。
3.拍摄快照
点击拍摄快照后,弹出下图,输入名称,快照就做好了。如果后面配置遇到问题,恢复快照即可。
4.恢复到快照
上面做好了快照,这里就可以恢复到某个快照了。
5.快照管理器
单击快照管理,就看到了备份的快照,如果备份了多个就能看到多个。可以恢复到任意一个备份的快照
以上有的朋友可能也知道的,但是合理的使用快照,可以提高搭建集群的效率
2.搭建缓存服务器
这里以ubuntu14.04为例:
源服务器名称可能不太准确,意思是创建内网自己的私服,这样只要有Ubuntu通过该私服下载安装过软件,私服都会缓存,下一个Ubuntu的请求就直接从缓存中获取。
首先安装apt-cacher
apt-get install apt-cacher
复制代码
装的过程中选择Daemon方式。
装完后,/etc/default/apt-cacher 文件内容应该如下:
AUTOSTART=1
复制代码
所以服务应该已经启动了。
到/etc/apt-cacher/apt-cacher.conf文件中修改一行配置,允许任何客户端访问:
allowed_hosts = *
复制代码
重启服务
service apt-cacher restart
复制代码
然后打开网页:http://your_ip:3142/apt-cacher
看到页面就说明服务器正常启动了。
在/etc/hosts文件中添加一行,可以帮助找到chrome依赖的dl.google.com
203.208.45.206 dl.google.com
复制代码
在客户端的ubuntu机器上,创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件
内容如下:
Acquire::http::Proxy "http://your_server:3142";
复制代码
然后运行apt-get update, 为了确认真的起作用。可以查看apt-cacher的日志,到服务器上查看目录下的日志文件
/var/log/apt-cacher
这里以openstack为例:
服务器ip地址为10.0.0.100:
cacher.png (60.75 KB, 下载次数: 0)
下载附件 保存到相册
2015-8-1 18:42 上传
客户端配置:
在客户端的ubuntu机器上,创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件
内容如下:
[Bash shell]
纯文本查看 复制代码
?
/var/log/apt-cacher
监控:
1.png (50.66 KB, 下载次数: 0)
下载附件 保存到相册
2015-8-1 18:45 上传
相关文章推荐
- 【大数据处理架构】0.综述-资料楼
- Keil MDK中 ST/Link 硬件仿真的配置,解决不进入main函数的方法
- 从大数据菜鸟走上大师的历程 Scala 第六讲 Map Zip
- 查找OGG trail file中是否存在相关记录的命令
- Kamailio安装指南
- Kamailio 的 SIP服务器使用经验
- 软件开发整理的一些工具
- (转载)高速ADC的关键指标:量化误差、offset/gain error、DNL、INL、ENOB、分辨率、RMS、SFDR、THD、SINAD、dBFS、TWO-TONE IMD
- Daily Scrum - 11/25
- 了解微软开源核心机器学习技术DMTK
- Chroot相关
- ST3插件——PlainTasks的使用
- Contains Duplicate in c
- yum报错: Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again
- LeetCode Contains Duplicate II
- AIDL 写法
- main函数的参数传递
- 载入OpenSSL的动态库——学会使用tryToLoadOpenSslWin32Library和QPair
- SharePoint 2013 Error - File names can't contain the following characters: & " ? < > # {} % ~ / \.
- Handler一定要在主线程实例化吗?new Handler()和new Handler(Looper.getMainLooper())的区别