Beautiful Soup使用
2016-09-21 15:08
106 查看
响应:soup = BeautifulSoup(response.body_as_unicode(), ‘lxml’)
本地:soup = BeautifulSoup(codecs.open(fileName, ‘r’, ‘utf-8’, ‘lxml’)
id = get(‘id’)
title = get(‘title’)
……
本地:soup = BeautifulSoup(codecs.open(fileName, ‘r’, ‘utf-8’, ‘lxml’)
获取标签的属性
文本 = getText()id = get(‘id’)
title = get(‘title’)
……
根据class和id选择标签
1.包含id属性
soup.find(class_=”“, id = True)2.id符合正则格式, id的格式形如”C_123…”,
soup.find(class_=”“, id = re.compile(”C_(.*)”))相关文章推荐
- 使用beautiful soup的一个简单爬图
- 可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据
- Beautiful Soup 使用总结
- 使用Beautiful Soup解析dom
- 使用Beautiful Soup扒取指定标题
- Beautiful Soup 4.4.0 基本使用方法
- 使用Beautiful Soup进行查找
- Python的Beautiful Soup简单使用
- 爬虫框架 Beautiful Soup 4 使用心得
- 可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据
- 使用Beautiful Soup编写一个爬虫 系列随笔汇总
- 使用 Beautiful Soup 解析网页内容
- 【python学习笔记】10:Beautiful Soup模块的使用
- Python爬虫学习(11):Beautiful Soup的使用
- 使用mechanize和Beautiful Soup轻松收集Web数据
- 可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据【转】
- 【python】Beautiful Soup的使用
- Python爬虫实战一之使用Beautiful Soup抓取‘谣言百科’的分类内容
- Beautiful Soup使用,登录知乎
- python3爬虫(二)-使用beautiful soup 读取网页