您的位置:首页 > 编程语言 > Python开发

学习笔记(18):150讲轻松搞定Python网络爬虫-xpath-在lxml中使用xpath语法

2020-03-06 14:35 459 查看
立即学习:https://edu.csdn.net/course/play/24756/280676?utm_source=blogtoedu from lxml import etree html = etree.parse('hello.html') # 获取所有li标签: result = html.xpath('//li') print(result) # for i in result: # print(etree.tostring(i)) # 获取所有li元素下的所有class属性的值: # result = html.xpath('//li/@class') # print(result) # 获取li标签下href为www.baidu.com的a标签: # result = html.xpath('//li/a[@href="www.baidu.com"]') # print(result) # 获取li标签下所有span标签: # result = html.xpath('//li//span') # print(result) # 获取li标签下的a标签里的所有class: # result = html.xpath('//li/a//@class') # print(result) # 获取最后一个li的a的href属性对应的值: # result = html.xpath('//li[last()]/a/@href') # print(result) # 获取倒数第二个li元素的内容: # result = html.xpath('//li[last()-1]/a') # print(result) # print(result[0].text) # 获取倒数第二个li元素的内容的第二种方式: result = html.xpath('//li[last()-1]/a/text()') print(result)
  • 点赞
  • 收藏
  • 分享
  • 文章举报
yi11131110 发布了17 篇原创文章 · 获赞 0 · 访问量 194 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐