您的位置:首页 > 编程语言 > Python开发

python---实战5筛选特定数据的长度、最多(字典、元组、列表、文件操作、替换)

2017-10-22 18:44 941 查看
python—实战5筛选特定数据的长度、最多(字典、元组、列表、文件操作、替换)

1、谁发的微博内容长度最长。

目标文件:百度网盘

http://pan.baidu.com/s/1kU6X2GB

所求问题为:该文本里,谁发的微博内容长度最长 (要求:输出用户的uid,字符串格式。)

python源码:

root@kali:~/python/laowangpy/datadig# cat 12lenmicroblog.py
#!/usr/bin/python
# --*-- coding:utf-8 --*--
import string
import time

text_userdata = open('twitterdata.txt').read()#对目标文本进行全部读取,并赋值
#print text_userdata

l = [n for n in text_userdata.split('\r\n')]#对目标文件使用\r\n进行分割,把分割好的每个元素加入列表n中
#print l[0]#打印第一个元素信息

i = 0
n = []
m = []#存储微博内容值的列表
p = []#存储UID内容值的列表
dictq = {}#存储微博内容与UID内容组成一一对应的字典

while l[i] != "":#当列表l中的元素不等于空白,则进入
s = l[i].replace('"','')#对列表l中每个元素中的"符号使用空白替换
n.append(s)#加入列表n中
t = s.split(",")#对列表s使用,分割
m.append(t[4])#对列表t中第四个元素加入列表m中,即是微博内容
p.append(t[1])#对列表t中第二个元素加入列表m中,即是UID内容
dictq[t[4]] = t[1]#把对应微博内容与UID名称一一对应组成字典
i = i + 1#循环加1

#print m[0]#打印列表m的第一个元素为uid的值
#print m
#print p
#print dictq

sortdictq = sorted(dictq.iteritems(),key=lambda d:len(d[0]),reverse=True)#对字典使用KEY值长度大小从大到小排序,变成列表
#排序 sorted(dic.iteritems(), key=lambda d:d[1], reverse=False)
#说明:对字典dic中的元素按照d1进行升序排序,通过设置reverse的True或False可以进行逆序,并返回排序后的字典(该排序后的字典由元组组成,其形式为[(key1,value1),(key2,value2),…],且原字典保持不变)

print sortdictq[0][1]#对字典变成以key值长度从大到小排序的列表,打印出最长度最大对应的value值信息
root@kali:~/python/laowangpy/datadig#


python运行结果情况:

root@kali:~/python/laowangpy/datadig# python 12lenmicroblog.py
612489475
root@kali:~/python/laowangpy/datadig#


打印的字典信息(部分省列)

root@kali:~/python/laowangpy/datadig# python 12lenmicroblog.py
[('\xe3\x80\x90\xe5\xae\x9a\xe6\x9c\x9f\xe3\x80\x91\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xb5\xe3\x83\x96\xe3\x83\x9e\xe3\x82\xb9\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\x8e\xe3\x83\x9c\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xaf\xe3\x83\x80\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\x8e\xe3\x83\x9c\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xaf\xe3\x83\x80\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93', '612489475'), ('RT@h_ototake:\xe3\x81\xaf\xe3\x82\x8b\xe3\x81\x8b\xe3\x81\x9c\xe3\x81\xa1\xe3\x82\x83\xe3\x82\x93\xe3\x81\x8c\xe6\xae\xba\xe4\xba\xba\xe4\xba\x88\xe5\x91\x8a\xe3\x81\xa8\xe3\x82\x82\xe5\x8f\x96\xe3\x82\x8c\xe3\x82\x8b\xe3\x83\x84\xe3\x82\xa4\xe3\x83\xbc\xe3\x83\x88\xe3\x82\x92\xe5\x8f\x97\xe3\x81\x91\xe3\x80\x81\xe8\xa6\xaa\xe5\xbe\xa1\xe3\x81\x95\xe3\x82\x93\xe3\x81\x8c\xe8\xad\xa6\xe5\xaf\x9f\xe3\x81\xab\xe9\x80\x9a\xe5\xa0\xb1\xe3\x81\x97\xe3\x81\x9f\xe3\x80\x82\xe3\x81\x9d\xe3\x82\x8c\xe3\x82\x92\xe5\x8f\x97\xe3\x81\x91\xe3\x81\xa6\xe3\x80\x81\xe3\x80\x8c\xe3\x81\xa0\xe3\x81\x8b\xe3\x82\x89\xe5\xb0\x8f\xe5\xad\xa6\xe7\x94\x9f\xe3\x81\xab\xe3\x83\x8d\xe3\x83\x83\xe3\x83\x88\xe3\x81\xaa\xe3\x82\x93\xe3\x81\x8b\xe3\x82\x84\xe3\x82\x89\xe3\x81\x9b\xe3\x82\x8b\xe3\x81\x8b\xe3\x82\x89\xe2\x80\xa6\xe3\x80\x8d\xe3\x81\xa8\xe3\x81\x84\xe3\x81\x86\xe6\x84\x9f\xe6\x83\xb3\xe3\x82\x92\xe6\xbc\x8f\xe3\x82\x89\xe3\x81\x97\xe3\x81\xa6\xe3\x81\x84\xe3\x82\x8b\xe4\xba\xba\xe3\x81\x8c\xe5\xa4\x9a\xe3\x81\x84\xe3\x81\x93\xe3\x81\xa8\xe3\x81\xab\xe9\xa9\x9a\xe3\x81\x8f\xe3\x80\x82\xe3\x80\x8c\xe9\x80\x80\xe5\xa0\xb4\xe3\x81\x99\xe3\x81\xb9\xe3\x81\x8d\xe3\x81\xaf\xe3\x80\x81\xe3\x81\x84\xe3\x81\x98\xe3\x82\x81\xe3\x82\x89\xe3\x82\x8c\xe3\x81\x9f\xe5\x81\xb4\xe3\x81\xa0\xe3\x80\x8d\xe3\x81\xa8\xe3\x81\x84\xe3\x81\x86\xe3\x82\x8f\xe3\x81\x91\xe3\x81\x8b\xe3\x80\x82\xe3\x81\x93\xe3\x82\x8c\xe3\x81\xa7\xe3\x81\xaf\xe3\x80\x81\xe3\x81\x84\xe3\x81\x98\xe3\x82\x81...', '28803555'),....................................
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 实战 字典
相关文章推荐