您的位置:首页 > 其它

Beautiful Soup使用

2016-09-21 15:08 106 查看
响应:soup = BeautifulSoup(response.body_as_unicode(), ‘lxml’)

本地:soup = BeautifulSoup(codecs.open(fileName, ‘r’, ‘utf-8’, ‘lxml’)

获取标签的属性

文本 = getText()

id = get(‘id’)

title = get(‘title’)

……

根据class和id选择标签

1.包含id属性

soup.find(class_=”“, id = True)

2.id符合正则格式, id的格式形如”C_123…”,

soup.find(class_=”“, id = re.compile(”C_(.*)”))
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  bs4 ptyhon scrapy