python---实战5筛选特定数据的长度、最多(字典、元组、列表、文件操作、替换)
2017-10-22 18:44
941 查看
python—实战5筛选特定数据的长度、最多(字典、元组、列表、文件操作、替换)
1、谁发的微博内容长度最长。
目标文件:百度网盘
http://pan.baidu.com/s/1kU6X2GB
所求问题为:该文本里,谁发的微博内容长度最长 (要求:输出用户的uid,字符串格式。)
python源码:
python运行结果情况:
打印的字典信息(部分省列)
1、谁发的微博内容长度最长。
目标文件:百度网盘
http://pan.baidu.com/s/1kU6X2GB
所求问题为:该文本里,谁发的微博内容长度最长 (要求:输出用户的uid,字符串格式。)
python源码:
root@kali:~/python/laowangpy/datadig# cat 12lenmicroblog.py #!/usr/bin/python # --*-- coding:utf-8 --*-- import string import time text_userdata = open('twitterdata.txt').read()#对目标文本进行全部读取,并赋值 #print text_userdata l = [n for n in text_userdata.split('\r\n')]#对目标文件使用\r\n进行分割,把分割好的每个元素加入列表n中 #print l[0]#打印第一个元素信息 i = 0 n = [] m = []#存储微博内容值的列表 p = []#存储UID内容值的列表 dictq = {}#存储微博内容与UID内容组成一一对应的字典 while l[i] != "":#当列表l中的元素不等于空白,则进入 s = l[i].replace('"','')#对列表l中每个元素中的"符号使用空白替换 n.append(s)#加入列表n中 t = s.split(",")#对列表s使用,分割 m.append(t[4])#对列表t中第四个元素加入列表m中,即是微博内容 p.append(t[1])#对列表t中第二个元素加入列表m中,即是UID内容 dictq[t[4]] = t[1]#把对应微博内容与UID名称一一对应组成字典 i = i + 1#循环加1 #print m[0]#打印列表m的第一个元素为uid的值 #print m #print p #print dictq sortdictq = sorted(dictq.iteritems(),key=lambda d:len(d[0]),reverse=True)#对字典使用KEY值长度大小从大到小排序,变成列表 #排序 sorted(dic.iteritems(), key=lambda d:d[1], reverse=False) #说明:对字典dic中的元素按照d1进行升序排序,通过设置reverse的True或False可以进行逆序,并返回排序后的字典(该排序后的字典由元组组成,其形式为[(key1,value1),(key2,value2),…],且原字典保持不变) print sortdictq[0][1]#对字典变成以key值长度从大到小排序的列表,打印出最长度最大对应的value值信息 root@kali:~/python/laowangpy/datadig#
python运行结果情况:
root@kali:~/python/laowangpy/datadig# python 12lenmicroblog.py 612489475 root@kali:~/python/laowangpy/datadig#
打印的字典信息(部分省列)
root@kali:~/python/laowangpy/datadig# python 12lenmicroblog.py [('\xe3\x80\x90\xe5\xae\x9a\xe6\x9c\x9f\xe3\x80\x91\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xb5\xe3\x83\x96\xe3\x83\x9e\xe3\x82\xb9\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\x8e\xe3\x83\x9c\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xaf\xe3\x83\x80\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\x8e\xe3\x83\x9c\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x82\xaf\xe3\x83\x80\xe3\x83\xaa\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93\xe3\x83\xac\xe3\x83\x83\xe3\x83\x89\xe3\x81\x95\xe3\x82\x93', '612489475'), ('RT@h_ototake:\xe3\x81\xaf\xe3\x82\x8b\xe3\x81\x8b\xe3\x81\x9c\xe3\x81\xa1\xe3\x82\x83\xe3\x82\x93\xe3\x81\x8c\xe6\xae\xba\xe4\xba\xba\xe4\xba\x88\xe5\x91\x8a\xe3\x81\xa8\xe3\x82\x82\xe5\x8f\x96\xe3\x82\x8c\xe3\x82\x8b\xe3\x83\x84\xe3\x82\xa4\xe3\x83\xbc\xe3\x83\x88\xe3\x82\x92\xe5\x8f\x97\xe3\x81\x91\xe3\x80\x81\xe8\xa6\xaa\xe5\xbe\xa1\xe3\x81\x95\xe3\x82\x93\xe3\x81\x8c\xe8\xad\xa6\xe5\xaf\x9f\xe3\x81\xab\xe9\x80\x9a\xe5\xa0\xb1\xe3\x81\x97\xe3\x81\x9f\xe3\x80\x82\xe3\x81\x9d\xe3\x82\x8c\xe3\x82\x92\xe5\x8f\x97\xe3\x81\x91\xe3\x81\xa6\xe3\x80\x81\xe3\x80\x8c\xe3\x81\xa0\xe3\x81\x8b\xe3\x82\x89\xe5\xb0\x8f\xe5\xad\xa6\xe7\x94\x9f\xe3\x81\xab\xe3\x83\x8d\xe3\x83\x83\xe3\x83\x88\xe3\x81\xaa\xe3\x82\x93\xe3\x81\x8b\xe3\x82\x84\xe3\x82\x89\xe3\x81\x9b\xe3\x82\x8b\xe3\x81\x8b\xe3\x82\x89\xe2\x80\xa6\xe3\x80\x8d\xe3\x81\xa8\xe3\x81\x84\xe3\x81\x86\xe6\x84\x9f\xe6\x83\xb3\xe3\x82\x92\xe6\xbc\x8f\xe3\x82\x89\xe3\x81\x97\xe3\x81\xa6\xe3\x81\x84\xe3\x82\x8b\xe4\xba\xba\xe3\x81\x8c\xe5\xa4\x9a\xe3\x81\x84\xe3\x81\x93\xe3\x81\xa8\xe3\x81\xab\xe9\xa9\x9a\xe3\x81\x8f\xe3\x80\x82\xe3\x80\x8c\xe9\x80\x80\xe5\xa0\xb4\xe3\x81\x99\xe3\x81\xb9\xe3\x81\x8d\xe3\x81\xaf\xe3\x80\x81\xe3\x81\x84\xe3\x81\x98\xe3\x82\x81\xe3\x82\x89\xe3\x82\x8c\xe3\x81\x9f\xe5\x81\xb4\xe3\x81\xa0\xe3\x80\x8d\xe3\x81\xa8\xe3\x81\x84\xe3\x81\x86\xe3\x82\x8f\xe3\x81\x91\xe3\x81\x8b\xe3\x80\x82\xe3\x81\x93\xe3\x82\x8c\xe3\x81\xa7\xe3\x81\xaf\xe3\x80\x81\xe3\x81\x84\xe3\x81\x98\xe3\x82\x81...', '28803555'),....................................
相关文章推荐
- python---实战3统计特定时间次数(文件操作、替换、列表、排序、去重、元组、集合)
- python---实战统计用户数量(文件操作、替换、列表、去重、元组)
- python---实战日志文件中查找特定字段,文件操作读写、排序、替换、列表、集合
- python学习-1-列表,元组,字典,集合,文件操作
- python---实战4统计特定时间中特定信息次数(替换、次数、列表、排序、元组)待完善
- python实操(5):python数据类型及常用操作,数字、字符串、元组、列表、字典、集合
- python学习-1-列表,元组,字典,集合,文件操作
- [置顶] Python联系笔记2[列表,元组,集合,字典,函数,文件操作,模块,类]
- Python 高效编程技巧实战(2-1)如何在列表,字典, 集合中根据条件筛选数据
- 列表、字典、元组、文件——Python
- python 列表、元组、字典 增删改查 等常用操作
- Python笔记第2章,文件,字符串,列表,元组,字典,集合的使用
- Python 元组、列表、字典、文件
- Python中数据结构 列表 元组 字典 序列
- python学习 第三篇字典,列表生成式,文件操作
- Python列表、字典、元组的一些基本操作
- python学习笔记2—python文件类型、变量、数值、字符串、元组、列表、字典
- Python 元组、列表、字典、字符串的操作
- Python 元组、列表、字典、文件
- python 中列表、元组、字典、文件的区别