您的位置：首页 > Web前端 > CSS

网页内容抓取分析---简单CSS选择器学习

2018-01-14 18:11 369 查看

创建爬虫，分析目标网页内容，可以通过xpath方法，或者Css选择器的方法。以下介绍常用的Css选择器使用方法


表达式	说明	时间
*	选择所有节点
# container	选择id为container的节点元素
.container	选取所有class包含container的节点元素
li a	选取li元素下面所有的a节点元素
ul + p	选择ul后面的第一个p元素
div # container > ul	选取id为container的div节点下面的第一个ul子元素
ul ~ p	选取与ul相邻的所有p元素
a[title]	选取所有具有 title属性的a元素
a[href=“http://51xiudao.cn”]	选取所有href属性为51xiudao.cn值得a元素
a[href*=”51xiudao”]	选取所有href属性包含51xiudao的a元素
a[href^=”http”]	选取所有href以http开头的a元素
a[href$=”.jpg”]	选取所有href以 .jpg 结尾的a元素
以上三项中 * ^ $ 涉及到正则表达式的相关内容	请查询我正则表达式相关文章
input[type=radio]:checked	选择宣州的radio元素
div:not(#container)	选择所有id不等于container的div元素
li:nth-child(3)	选取第三个li元素
tr:nth-child(2n)	选取偶数行
新增	实用方法
h1::text	伪类选择器,获取 h1 标签内的文本(爬虫获取内容超级实用)
a::attr(href)	伪类选择器,获取a连接href属性值	01/15
.abc.def	css中用两个class定位一个元素例如< div class=”abc def” >xxx< / div>	01/15

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Css

相关文章推荐

新的分享

章节导航