学习笔记(18):150讲轻松搞定Python网络爬虫-xpath-在lxml中使用xpath语法
2020-03-06 14:35
459 查看
立即学习:https://edu.csdn.net/course/play/24756/280676?utm_source=blogtoedu
from lxml import etree
html = etree.parse('hello.html')
# 获取所有li标签:
result = html.xpath('//li')
print(result)
# for i in result:
# print(etree.tostring(i))
# 获取所有li元素下的所有class属性的值:
# result = html.xpath('//li/@class')
# print(result)
# 获取li标签下href为www.baidu.com的a标签:
# result = html.xpath('//li/a[@href="www.baidu.com"]')
# print(result)
# 获取li标签下所有span标签:
# result = html.xpath('//li//span')
# print(result)
# 获取li标签下的a标签里的所有class:
# result = html.xpath('//li/a//@class')
# print(result)
# 获取最后一个li的a的href属性对应的值:
# result = html.xpath('//li[last()]/a/@href')
# print(result)
# 获取倒数第二个li元素的内容:
# result = html.xpath('//li[last()-1]/a')
# print(result)
# print(result[0].text)
# 获取倒数第二个li元素的内容的第二种方式:
result = html.xpath('//li[last()-1]/a/text()')
print(result)
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- 学习笔记(01):21天搞定分布式Python网络爬虫-xpath-在lxml中使用xpath语法
- 学习笔记(03):21天搞定分布式Python网络爬虫-xpath-实战-爬取瓜子二手车网站(1)...
- 学习笔记(02):21天搞定分布式Python网络爬虫-xpath-实战-爬取瓜子二手车网站(1)...
- Python爬虫(入门+进阶)学习笔记 1-4 使用Xpath解析豆瓣短评
- python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容
- 韩顺平_轻松搞定网页设计(html+css+javascript)_第19讲_js运行原理_js开发工具介绍_js程序(hello)_js基本语法_学习笔记_源代码图解_PPT文档整理
- Python高级语法——正则表达式和XPath——学习心得笔记
- 学习笔记(09):5天Python闯关训练营-104期-XPath语法与案例
- Python学习笔记-ubuntu安装setuptools及使用
- python学习笔记+使用技巧
- Python学习笔记—PyQuery库的使用总结
- 01-Python学习笔记-基础语法
- Python学习笔记——Python中的基本语法2
- python学习笔记18-重点和忘记知识点总结
- 韩顺平_轻松搞定网页设计(html+css+javascript)_第26讲_js函数调用过程内存分析_js函数细节_学习笔记_源代码图解_PPT文档整理
- Java学习笔记——MySQL的安装使用以及SQL语法简介
- [Python]python学习笔记(一)——语法
- Python学习18:os标准库模块使用(二),path模块使用
- Python学习笔记-第三章 使用字符串
- python学习笔记28(python中pickle的使用)