您的位置:首页 > 编程语言 > Python开发

python学习之爬虫:BeautifulSoup

2017-12-07 17:56 483 查看
一、功能:

BeautifulSoup是用来从HTML或XML中提取数据的Python库。

二、导入:

from bs4 import BeautifulSoup

import bs4

三、编码格式:

soup使用Unicode编码

四、对象种类:

有四种类型:Tag,NavigableString,BeautifulSoup,Comment。
BeautifulSoup将文档转化为树形结构,每个节点都是上述四种类型的Python对象。

tag属性:name、attrs

参考网址:

1、http://python.jobbole.com/84774/

2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup

3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: