您的位置:首页 > 理论基础 > 计算机网络

python爬虫(1)利用BeautifulSoup进行网络数据采集

2018-03-01 23:03 776 查看
   BeautifulSoup库的名字来源于路易斯.卡罗尔在《爱丽丝梦游仙境》里的同名诗歌,BeautifulSoup化平淡为神奇,它通过定位HTML标签来格式化和组织复杂的网络信息,用简单易用的Python对象为我们展现结构信息。
在我们安装完Anaconda之后就自带BS4了

首先,我们利用BeautifulSoup来得到百度的标题:
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://www.baidu.com")
Bs_html = BeautifulSoup(html)
print(Bs_html.title)

输出结果为:


我们先用了一下这个神奇的函数,但是它的真正强大之处还远不止于此
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: