您的位置：首页 > 编程语言 > Python开发

python之html网页匹配查找

2013-10-24 21:23 253 查看

# -*- coding: utf-8 -*-import urllibimport urlparseimport HTMLParserimport rer=urllib.urlopen(u"http://v.youku.com/v_show/id_XNjA4Mzg2MDg4.html")content=r.fp.read()

#valuetitle=re.findall(r'<h1 class="title".+.</h1>',content)s = re.findall(r'http://player.youku.com.*.swf',content)
print title[0].decode('utf-8').encode('utf-8')print s[0]

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

Javascript、js 查找匹配网页html中图片url
python学习—保存网页到本地 html及pdf
PYTHON-全字匹配查找
使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies（二）
Python实现抓取HTML网页并以PDF文件形式保存的方法
Python 网页解析HTMLParse的实例详解
Python3.X抓取网页html乱码问题
python︱HTML网页解析BeautifulSoup学习笔记
python re正则匹配网页中图片url地址
python抓取网页的html
（转载）Python写爬虫--抓取网页并解析HTML
python题目-----匹配HTML Tag<.*>和<.*?>区别
[python] 常用正则表达式爬取网页信息及分析HTML标签总结
Python之HTML的解析（网页抓取一）
python︱HTML网页解析BeautifulSoup学习笔记
使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
Python写爬虫——抓取网页并解析HTML
Python:在网页中查找字符串的一般方法--in
python用lxml匹配html内容
python爬虫由浅入深6--基于bs4库的HTML内容的查找方法

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航