python xpath获取页面注释
2017-09-07 14:16
176 查看
版本信息:
python 2.7.12lxml 3.8.0
from lxml import etree
html_str = """
<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!
<div id="box2">*****
<!--can u get me, bitch?-->
</div>
</div>
"""
html = etree.HTML(html_str)
print html.xpath('//div[@id="box1"]/div/node()')[1]
print type(html.xpath('//div[@id="box1"]/div/node()')[1])
print html.xpath('//div[@id="box1"]/div/node()')[1].text
"""output:
<!--can u get me, bitch?-->
<type 'lxml.etree._Comment'>
can u get me, bitch?
"""——
不让转载!
面向百度编程 百度竟然没有 于是 又转回了 面向巧合编程 结果靠猜靠试竟然试出来了
相关文章推荐
- Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
- Python网页抓取:获取页面中某段内容的xpath
- selenium自动化测试工具开发python爬虫-动态加载页面数据获取
- python---get请求https的页面,并获取html返回的内容信息
- python之获取页面标签的方法
- (转)用python获取页面返回的cookie
- 获取web页面xpath
- <Python>页面元素定位方式:xpath----轴定位方式
- 各种浏览器下的页面元素xpath获取方法
- python 脚本(获取指定文件夹、指定文件格式、的代码行数、注释行数)
- Python爬虫入门之一(获取页面响应)
- Python从菜鸟到高手(6):获取用户输入、函数与注释
- 页面元素定位 id 和 xpath 使用selenium IDE 浏览器插件获取
- python 获取页面表格数据存放到csv中
- python爬虫-第一步,获取页面
- python爬虫初级--获取指定页面上的菜单名称以及链接,然后导出
- Python PhatomJS 和Selenium动态加载页面 获取图片内容
- python从页面获取中文,写入指定文件中
- Python获取当前页面内所有链接的四种方法对比分析
- appium python 获取手机页面信息