hadoop中使用python写mapreduce遇到的问题
2014-08-30 02:15
405 查看
用python测试下mapreduce,于是去百度了一个博客,直接按照步骤来,按其一步一步的来,但是结果一直错误。于是google找到一篇更加详细的,才发现刚才看的博客是copy的这个英文版的。 英文版的很全面,而且指令与中文版的不太一样。我按照英文版提供的指令,顺利的完成了python写mapreduce的计数。但想了想,耽误了我好长时间。以后尽量用google吧。
使用python写mapreduce的感觉是,省事,舒服,不需要继承什么类,直接标准输入与输出,要什么逻辑写什么逻辑,直接与业务挂钩。不过这只是刚开始用的体验,以后会记录更多的使用python编写mapreduce的感受。
记录python执行的指令
中文版 测试有误
英文原版提供的
是不是很有条理,而且 如果想指定reducer的个数,可以这样子:
使用python写mapreduce的感觉是,省事,舒服,不需要继承什么类,直接标准输入与输出,要什么逻辑写什么逻辑,直接与业务挂钩。不过这只是刚开始用的体验,以后会记录更多的使用python编写mapreduce的感受。
记录python执行的指令
中文版 测试有误
hadoop@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-0.19.1-streaming.jar -mapper /home/hadoop/mapper.py -reducer /home/hadoop/reducer.py -input gutenberg/* -output gutenberg-output
英文原版提供的
1 2 3 4 | hduser@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar \ -file /home/hduser/mapper.py -mapper /home/hduser/mapper.py \ -file /home/hduser/reducer.py -reducer /home/hduser/reducer.py \ -input /user/hduser/gutenberg/* -output /user/hduser/gutenberg-output |
1
hduser@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar -D mapred.reduce.tasks=16 ...
相关文章推荐
- 使用Python实现Hadoop MapReduce程序遇到的问题解决办法
- 如何使用Python为Hadoop编写一个简单的MapReduce程序
- 使用Python实现Hadoop MapReduce程序
- 使用Python实现Hadoop MapReduce程序
- hadoop streaming python 处理 lzo 文件遇到的问题
- spark结合Hadoop2.2.0 HA使用中遇到的问题
- 如何使用Python为Hadoop编写一个简单的MapReduce程序
- 如何使用Python为Hadoop编写一个简单的MapReduce程序
- 使用Python实现Hadoop MapReduce程序
- 使用python构建基于hadoop的mapreduce日志分析平台
- 使用python写程序时遇到的几个小问题
- windows平台使用Cygwin安装hadoop遇到的问题
- 初次使用hadoop时遇到的问题.
- 使用Python实现Hadoop MapReduce程序
- Python2.5使用新浪微博Python SDK遇到的问题与解决方法
- python使用遇到的问题
- centos中使用python遇到的几个问题
- centos中使用python遇到的几个问题
- 使用python构建基于hadoop的mapreduce日志分析平台
- 使用Hadoop API操作HDFS文件时遇到的问题及解决总结