您的位置:首页 > 编程语言 > Python开发

python简单实现hadoop map reduce统计功能

2013-10-11 15:30 766 查看
#!/usr/bin/env python

def hadoopMap(fd):
lines={}
for line in fd:
if lines.has_key(line):
lines[line]+=1
else:
lines[line]=1

return lines

def hadoopReduce(result,mapResult):
for key in mapResult:
if result.has_key(key):
result[key]+=mapResult[key]
else:
result[key]=mapResult[key]
print result
return result
fd=(open("test.0",'r'),open("test.1"))
mapData=map(hadoopMap,fd)
for fds in fd:
fds.close()
print mapData
reduceResult=reduce(hadoopReduce,mapData,{})
print reduceResult
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: