您的位置:首页 > 编程语言 > Python开发

python 解析html 时lxml跟beautifulSoup对比

2013-05-13 10:37 741 查看
根据我使用经验lxml比beautifulSoup速度更快,容错和处理能力更强。

lxml示例如下:

      def getGooglePlayAppInfo(self):
pageUrl='https://play.google.com/store/apps/details?id=com.taobao.taobao'
pageUrl_openHandle=self.open_url(pageUrl)
if pageUrl_openHandle:
pageUrlHtmlSource=pageUrl_openHandle.read().decode("utf-8")
#print pageUrlHtmlSource
doc=etree.HTML(pageUrlHtmlSource)
hrefs = doc.xpath(u"//a[@class=\"doc-header-link\"]")
for href in hrefs:
print href.text


  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: