基于python的-取网址字符串练习
2018-01-30 15:35
337 查看
# -*- coding:utf-8 -*- ''' <div class="item-list ni-list"><ul><li class="first"><a href="http://www.tepintehui.com/detail/57185?ce" title="明星同款| 钟基欧巴穿的小脏鞋5折辣!" ><span>明星同款| 钟基欧巴穿的小脏鞋5折辣!</span></a></li><li><a href="http://www.tepintehui.com/detail/56847?ce" title="装逼| 你们见过凌晨四点钟的洛杉矶吗?" ><span>装逼| 你们见过凌晨四点钟的洛杉矶吗?</span></a></li><li ><a href="http://www.tepintehui.com/detail/57127?ce" title="反人类| 世界上最干净的纸竟然是黄色的!" ><span>反人类| 世界上最干净的纸竟然是黄色的</span></a></li><li><a href="http://www.tepintehui.com/detail/57120?ce" title="科普| 吃了避孕药之后怀的孩子能要吗?" ><span>科普| 吃了避孕药之后怀的孩子能要吗?</span></a></li><li><a href="http://www.tepintehui.com/detail/57125?ce" title="真假| 9年义务升为12年制,是要取消高考吗" ><span>真假| 9年义务升为12年制,是要取消高考吗</span></a></li><li><a href="http://www.tepintehui.com/detail/57124?ce" title="土豪| 揭秘迪士尼见不得光的33号俱乐部" ><span>土豪| 揭秘迪士尼见不得光的33号俱乐部</span></a></li><li ><a href="http://www.tepintehui.com/detail/41008?ce" title="吐槽| 男人单身太久会没感觉?" ><span>吐槽| 男人单身太久会没感觉?</span></a></li><li ><a href="http://www.tepintehui.com/detail/23488?ce" title="冷知识| 为什么镜子是左右颠倒不是上下呢" ><span>冷知识| 为什么镜子是左右颠倒不是上下呢</span></a></li><li ><a href="http://www.tepintehui.com/detail/37213?ce" title="新玩法| 这年头情侣之间种草莓已经out了!" ><span>新玩法| 这年头情侣之间种草莓已经out了!</span></a></li><li ><a href="http://www.tepintehui.com/detail/11411?ce" title="四壁| 老美说凤姐把范冰冰秒成渣,你怎么看" ><span>四壁| 老美说凤姐把范冰冰秒成渣,你怎么看</span></a></li><li ><a href="http://www.tepintehui.com/detail/37456?ce" title="凭什么| 个人挖墓是盗墓,国家挖是考古?" ><span>凭什么| 个人挖墓是盗墓,国家挖是考古?</span></a></li><li ><a href="http://www.tepintehui.com/detail/40706?ce" title="福利| 要知道加这个群这么爽!我早进了" ><span>福利| 要知道加这个群这么爽!我早进了</span></a></li></ul></div> ''' ''' 练习1: 从上面的字符串中,将所有a标签的href值取出来,输出样式为: http://www.tepintehui.com/detail/40706?ce http://www.tepintehui.com/detail/40706?ce http://www.tepintehui.com/detail/40706?ce http://www.tepintehui.com/detail/40706?ce http://www.tepintehui.com/detail/40706?ce http://www.tepintehui.com/detail/40706?ce ''' string = '<div class="item-list ni-list"><ul><li class="first"><a href="http://www.tepintehui.com/detail/57185?ce" title="明星同款| 钟基欧巴穿的小脏鞋5折辣!" ><span>明星同款| 钟基欧巴穿的小脏鞋5折辣!</span></a></li><li><a href="http://www.tepintehui.com/detail/56847?ce" title="装逼| 你们见过凌晨四点钟的洛杉矶吗?" ><span>装逼| 你们见过凌晨四点钟的洛杉矶吗?</span></a></li><li ><a href="http://www.tepintehui.com/detail/57127?ce" title="反人类| 世界上最干净的纸竟然是黄色的!" ><span>反人类| 世界上最干净的纸竟然是黄色的</span></a></li><li><a href="http://www.tepintehui.com/detail/57120?ce" title="科普| 吃了避孕药之后怀的孩子能要吗?" ><span>科普| 吃了避孕药之后怀的孩子能要吗?</span></a></li><li><a href="http://www.tepintehui.com/detail/57125?ce" title="真假| 9年义务升为12年制,是要取消高考吗" ><span>真假| 9年义务升为12年制,是要取消高考吗</span></a></li><li><a href="http://www.tepintehui.com/detail/57124?ce" title="土豪| 揭秘迪士尼见不得光的33号俱乐部" ><span>土豪| 揭秘迪士尼见不得光的33号俱乐部</span></a></li><li ><a href="http://www.tepintehui.com/detail/41008?ce" title="吐槽| 男人单身太久会没感觉?" ><span>吐槽| 男人单身太久会没感觉?</span></a></li><li ><a href="http://www.tepintehui.com/detail/23488?ce" title="冷知识| 为什么镜子是左右颠倒不是上下呢" ><span>冷知识| 为什么镜子是左右颠倒不是上下呢</span></a></li><li ><a href="http://www.tepintehui.com/detail/37213?ce" title="新玩法| 这年头情侣之间种草莓已经out了!" ><span>新玩法| 这年头情侣之间种草莓已经out了!</span></a></li><li ><a href="http://www.tepintehui.com/detail/11411?ce" title="四壁| 老美说凤姐把范冰冰秒成渣,你怎么看" ><span>四壁| 老美说凤姐把范冰冰秒成渣,你怎么看</span></a></li><li ><a href="http://www.tepintehui.com/detail/37456?ce" title="凭什么| 个人挖墓是盗墓,国家挖是考古?" ><span>凭什么| 个人挖墓是盗墓,国家挖是考古?</span></a></li><li ><a href="http://www.tepintehui.com/detail/40706?ce" title="福利| 要知道加这个群这么爽!我早进了" ><span>福利| 要知道加这个群这么爽!我早进了</span></a></li></ul></div>' # 方法1: rs_list = string.split('"') for x in range(0,len(rs_list)): rs = rs_list[x].startswith('http') if rs == True: print(rs_list[x]) else: continue # 方法2: start = string.find('http') # 只要start不等于-1,说明找到了http while start != -1: # 找结束的位置 end = string.find('?ce',start) # 截取字符串 结束位置=结束字符串的开始位置+结束字符串的长度 sub_str = string[start:end+len('?ce')] print(sub_str) start = string.find('http',end)
相关文章推荐
- 复习1次课(11月28日) 1.3 python的文件类型 1.4 python的变量 1.5 python的数值和字符串 1.6 元组 1.7 列表 1.8 字典 1.9 字典练习
- Python入门练习(一):基于全切分,一元语法模型的汉语分词
- 基于python的字符串转整数小程序(手写int()内置函数实现细节)
- python之字符串练习
- python编程练习-字符串移位练习题
- python之字符串练习
- 提取网址的python练习
- 字符串反转-基于Python的6种方法比较(最全总结版本!)
- 02-python练习:打印歌词(字符串操作练习),播放器播放歌词方式(到时间出现对应歌词)
- Python基础练习——字符串和字典的转换
- python小练习之将字符串转换成第一个字母大写后面字母小写的形式
- python笔记4 - 索引,切片,字符编码转换函数,字符串的属性方法,字符串格式化表达式,占位符,基于字典的字符串格式化,循环语句
- python 实验6 字符串练习(二)
- 蓝桥杯 基础练习 FJ的字符串 PYTHON
- 购物小票——Python字符串格式化练习
- PYTHON中基于类的异常取代基于字符串的异常
- 基于《PythonCookbook》的学习(1)——针对任意多的分隔符拆分字符串
- python学习练习提高网址
- Python基础练习——字符串相关
- Python练习代码 -- 字符串和正则表达式, 文件文件夹操作