您的位置:首页 > 理论基础 > 计算机网络

使用python访问网络数据 第二周:Extracting Data With Regular Expressions

2016-11-18 19:14 525 查看
作业大意:

提取出文本中的所有数字,并且转换成int类型后相加,求出累加和

当然是使用正则表达式了,然后先文件按行读入,然后对每行进行正则表达式处理 re.findall('[0-9]+',line) 代表在当前行找到至少出现一次的数字

之前用了[0-9]* 发现出来一大堆空,现在想想区别就是至少出现一次和出现或者不出现,区别还是很大的。

这个作业数据不一样,但是我把的我数据放上来,可以自己测试着玩

SamlpeData : http://python-data.dr-chuck.net/regex_sum_42.txt 累加和:445822

TestData:http://python-data.dr-chuck.net/regex_sum_316190.txt 累加和:最后三位是313

import re
fh = open('text2.txt')
sum = 0
for line in fh:
line = line.strip()
a = re.findall('[0-9]+',line)
for j in a :
j = int(j)
sum+=j
print(sum)
代入第二个数据:346313 验证成功
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: