您的位置:首页 > Web前端 > CSS

网页内容抓取分析---简单CSS选择器学习

2018-01-14 18:11 369 查看

Css 选择器

创建爬虫,分析目标网页内容,可以通过xpath方法,或者Css选择器的方法。以下介绍常用的Css选择器使用方法


表达式说明时间
*选择所有节点
# container选择id为container的节点元素
.container选取所有class包含container的节点元素
li a选取li元素下面所有的a节点元素
ul + p选择ul后面的第一个p元素
div # container > ul选取id为container的div节点下面的第一个ul子元素
ul ~ p选取与ul相邻的所有p元素
a[title]选取所有具有 title属性的a元素
a[href=“http://51xiudao.cn”]选取所有href属性为51xiudao.cn值得a元素
a[href*=”51xiudao”]选取所有href属性包含51xiudao的a元素
a[href^=”http”]选取所有href以http开头的a元素
a[href$=”.jpg”]选取所有href以 .jpg 结尾的a元素
以上三项中 * ^ $ 涉及到正则表达式的相关内容请查询我正则表达式相关文章
input[type=radio]:checked选择宣州的radio元素
div:not(#container)选择所有id不等于container的div元素
li:nth-child(3)选取第三个li元素
tr:nth-child(2n)选取偶数行
新增实用方法
h1::text伪类选择器,获取 h1 标签内的文本(爬虫获取内容超级实用)
a::attr(href)伪类选择器,获取a连接href属性值01/15
.abc.defcss中用两个class定位一个元素 例如< div class=”abc def” >xxx< / div>01/15

关于更多的Css 选择器相关知识,请google学习

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Css