您的位置：首页 > 编程语言 > Python开发

python 解析html 时lxml跟beautifulSoup对比

2013-05-13 10:37 741 查看

根据我使用经验lxml比beautifulSoup速度更快，容错和处理能力更强。

lxml示例如下：

　　　　　　def getGooglePlayAppInfo(self):
pageUrl='https://play.google.com/store/apps/details?id=com.taobao.taobao'
pageUrl_openHandle=self.open_url(pageUrl)
if pageUrl_openHandle:
pageUrlHtmlSource=pageUrl_openHandle.read().decode("utf-8")
#print pageUrlHtmlSource
doc=etree.HTML(pageUrlHtmlSource)
hrefs = doc.xpath(u"//a[@class=\"doc-header-link\"]")
for href in hrefs:
print href.text

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

转：Python网页解析：BeautifulSoup vs lxml.html
Python网页解析：BeautifulSoup vs lxml.html
python 解析html之BeautifulSoup
python 解析html之BeautifulSoup
python爬虫-html解析器beautifulsoup
Python lxml解析HTML并用xpath获取元素
Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
Python+lxml解析html
BeautifulSoup提示找不到lxml解析包的解决方法
python 使用lxml解析html（xpath）
python中用lxml解析html
【小平工作日志】python利用lxml解析抓取的html页面
Python使用lxml解析HTML response
Python 边做边学 8.4 工具类--HTML解析工具（HtmlSoupUtil）
使用python的lxml解析html
lxml: Cannot import lxml.html.soupparser.fromstring, depends on outdated BeautifulSoup
Python requests+gevent+BeautifulSoup lxml 干点啥-加点速
【Python】beautifusoup解析HTML并将数据写入文件
HTML解析之四：BeautifulSoup4的使用
如何从word开始处理html文件？以及windows上安装python lxml beautifulsoup

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航