python学习之爬虫:BeautifulSoup
2017-12-07 17:56
483 查看
一、功能:
BeautifulSoup是用来从HTML或XML中提取数据的Python库。
import bs4
三、编码格式:
soup使用Unicode编码
BeautifulSoup将文档转化为树形结构,每个节点都是上述四种类型的Python对象。
tag属性:name、attrs
参考网址:
1、http://python.jobbole.com/84774/
2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup
3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html
BeautifulSoup是用来从HTML或XML中提取数据的Python库。
二、导入:
from bs4 import BeautifulSoupimport bs4
三、编码格式:
soup使用Unicode编码
四、对象种类:
有四种类型:Tag,NavigableString,BeautifulSoup,Comment。BeautifulSoup将文档转化为树形结构,每个节点都是上述四种类型的Python对象。
tag属性:name、attrs
参考网址:
1、http://python.jobbole.com/84774/
2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup
3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html
相关文章推荐
- python学习(6):python爬虫之requests和BeautifulSoup的使用
- Python爬虫包 BeautifulSoup 学习(八) parent等应用
- Python爬虫包 BeautifulSoup 学习(九) 正则表达式与Lambda表达式
- Python爬虫包 BeautifulSoup 学习(十一) CSS 选择器
- Python爬虫包 BeautifulSoup 学习(四) bs基本对象与函数
- python beautifulsoup 爬虫学习
- python爬虫【记录】BeautifulSoup 的用法遍历学习
- python库学习笔记——爬虫常用的BeautifulSoup的介绍
- Python爬虫包 BeautifulSoup 学习(三) 实例
- python3个人爬虫之:BeautifulSoup学习心得
- Python 网页爬虫-BeautifulSoup库的学习
- Python爬虫包 BeautifulSoup 学习(十) 各种html解析器的比较及使用
- Python爬虫包 BeautifulSoup 学习(七) children等应用
- Python爬虫包 BeautifulSoup 学习(五) 实例
- Python爬虫包 BeautifulSoup 学习(六) 递归抓取
- Python爬虫包 BeautifulSoup 学习(二) 异常处理
- Python爬虫包BeautifulSoup学习实例(五)
- 【Python3.6爬虫学习记录】(二)使用BeautifulSoup爬取简单静态网页文章
- Python爬虫包 BeautifulSoup 学习(一) 简介与安装
- python爬虫——beautifulsoup4使用学习