python之html网页匹配查找
2013-10-24 21:23
253 查看
# -*- coding: utf-8 -*-import urllibimport urlparseimport HTMLParserimport rer=urllib.urlopen(u"http://v.youku.com/v_show/id_XNjA4Mzg2MDg4.html")content=r.fp.read()
#valuetitle=re.findall(r'<h1 class="title".+.</h1>',content)s = re.findall(r'http://player.youku.com.*.swf',content)
print title[0].decode('utf-8').encode('utf-8')print s[0]
#valuetitle=re.findall(r'<h1 class="title".+.</h1>',content)s = re.findall(r'http://player.youku.com.*.swf',content)
print title[0].decode('utf-8').encode('utf-8')print s[0]
相关文章推荐
- Javascript、js 查找匹配网页html中图片url
- python学习—保存网页到本地 html及pdf
- PYTHON-全字匹配查找
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- Python实现抓取HTML网页并以PDF文件形式保存的方法
- Python 网页解析HTMLParse的实例详解
- Python3.X抓取网页html乱码问题
- python︱HTML网页解析BeautifulSoup学习笔记
- python re正则匹配网页中图片url地址
- python抓取网页的html
- (转载)Python写爬虫--抓取网页并解析HTML
- python题目-----匹配HTML Tag<.*>和<.*?>区别
- [python] 常用正则表达式爬取网页信息及分析HTML标签总结
- Python之HTML的解析(网页抓取一)
- python︱HTML网页解析BeautifulSoup学习笔记
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
- Python写爬虫——抓取网页并解析HTML
- Python:在网页中查找字符串的一般方法--in
- python用lxml匹配html内容
- python爬虫由浅入深6--基于bs4库的HTML内容的查找方法