您的位置：首页 > 编程语言 > Python开发

python简单实现hadoop map reduce统计功能

2013-10-11 15:30 766 查看

#!/usr/bin/env python

def hadoopMap(fd):
lines={}
for line in fd:
if lines.has_key(line):
lines[line]+=1
else:
lines[line]=1

return lines

def hadoopReduce(result,mapResult):
for key in mapResult:
if result.has_key(key):
result[key]+=mapResult[key]
else:
result[key]=mapResult[key]
print result
return result
fd=(open("test.0",'r'),open("test.1"))
mapData=map(hadoopMap,fd)
for fds in fd:
fds.close()
print mapData
reduceResult=reduce(hadoopReduce,mapData,{})
print reduceResult

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

php ajax网站浏览统计功能的简单实现第1/2页
python代码简单实现一个词频统计
一个简单的程序，统计文本文档中的单词和汉字数，逆序排列（出现频率高的排在最前面）。python实现。
python实现简单的switch功能
Python实现简单生成验证码功能【基于random模块】
[置顶] 网站浏览统计功能的简单实现-- vb2005xu自己动手系列(2)
python实现简单爬虫功能
Python实现的简单模板引擎功能示例
Python 简单爬虫功能实现
Python实现简单的获取图片爬虫功能示例
python实现简单爬虫功能
python实现简单爬虫功能
【PythonDjango后台实例第六章】Django实现简单的登陆验证功能
用 python实现简单EXCEL数据统计
python实现简单爬虫功能
利用python实现简单的循环购物车功能示例代码
Selenium + PhantomJS + python 简单实现爬虫的功能
Python实现简单爬虫功能--批量下载百度贴吧里的图片
python实现简单爬虫功能
最简单方法：windows平台下python安装opencv，即实现import cv2功能

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航