您的位置：首页 > 编程语言 > Python开发

学习笔记(18):150讲轻松搞定Python网络爬虫-xpath-在lxml中使用xpath语法

2020-03-06 14:35 459 查看

立即学习:https://edu.csdn.net/course/play/24756/280676?utm_source=blogtoedu from lxml import etree html = etree.parse('hello.html') # 获取所有li标签： result = html.xpath('//li') print(result) # for i in result: # print(etree.tostring(i)) # 获取所有li元素下的所有class属性的值： # result = html.xpath('//li/@class') # print(result) # 获取li标签下href为www.baidu.com的a标签： # result = html.xpath('//li/a[@href="www.baidu.com"]') # print(result) # 获取li标签下所有span标签： # result = html.xpath('//li//span') # print(result) # 获取li标签下的a标签里的所有class： # result = html.xpath('//li/a//@class') # print(result) # 获取最后一个li的a的href属性对应的值： # result = html.xpath('//li[last()]/a/@href') # print(result) # 获取倒数第二个li元素的内容： # result = html.xpath('//li[last()-1]/a') # print(result) # print(result[0].text) # 获取倒数第二个li元素的内容的第二种方式： result = html.xpath('//li[last()-1]/a/text()') print(result)

点赞
收藏
分享
文章举报

yi11131110 发布了17 篇原创文章 · 获赞 0 · 访问量 194 私信关注

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航