python简单实现hadoop map reduce统计功能
2013-10-11 15:30
766 查看
#!/usr/bin/env python def hadoopMap(fd): lines={} for line in fd: if lines.has_key(line): lines[line]+=1 else: lines[line]=1 return lines def hadoopReduce(result,mapResult): for key in mapResult: if result.has_key(key): result[key]+=mapResult[key] else: result[key]=mapResult[key] print result return result fd=(open("test.0",'r'),open("test.1")) mapData=map(hadoopMap,fd) for fds in fd: fds.close() print mapData reduceResult=reduce(hadoopReduce,mapData,{}) print reduceResult
相关文章推荐
- php ajax网站浏览统计功能的简单实现第1/2页
- python代码简单实现一个词频统计
- 一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。
- python实现简单的switch功能
- Python实现简单生成验证码功能【基于random模块】
- [置顶] 网站浏览统计功能的简单实现-- vb2005xu自己动手系列(2)
- python实现简单爬虫功能
- Python实现的简单模板引擎功能示例
- Python 简单爬虫功能实现
- Python实现简单的获取图片爬虫功能示例
- python实现简单爬虫功能
- python实现简单爬虫功能
- 【PythonDjango后台实例 第六章】Django实现简单的登陆验证功能
- 用 python实现简单EXCEL数据统计
- python实现简单爬虫功能
- 利用python实现简单的循环购物车功能示例代码
- Selenium + PhantomJS + python 简单实现爬虫的功能
- Python实现简单爬虫功能--批量下载百度贴吧里的图片
- python实现简单爬虫功能
- 最简单方法:windows平台下python安装opencv,即实现import cv2功能