您的位置:首页 > 编程语言 > Python开发

(一)BeautifulSoup的安装

2016-03-26 21:41 471 查看

一.BeautifulSoup的安装

windows下的安装

确保必要的工作(已经安装好python和pip)

一般在官网下载最新的python时,已经回默认安装好pip了,只要在选择的时候勾选添加到环境变量,就不需要自己手动的设置环境变量。

运行cmd,在命令行中输入一下命令即可安装成功。

pip install BeautifulSoup4


linux下的安装

由于本人使用的是ubuntu,即主要讲解的是ubuntu下的安装,其实其他发行版本的安装都是差不多的。

安装python

由于在ubuntu的发行版本中已经自带有python,即可以略过这一步

安装pip

默认是没有安装pip的,打开shell,输入一下命令即可安装pip,此方法比较方便快捷。

sudo apt-get install python-pip


BeautifulSoup安装

由于BeautifulSoup已经集成到了ubuntu的源中,所以,可以直接运行一下命令直接安装(用这个方法可以跳过第二步pip的安装)

sudo apt-get install Python-bs4


或者使用如windows下的安装方式(第二步必须安装成功,推荐使用上一种方式,简单快捷不易出错)

pip install beautifulSoup4


二.解析器的安装

由于BeautifulSoup4支持多种解析器,但其中,lxml的解析速度比较快的,所以,必须安装lxml解析器。当然,如果觉得不需要lxml解析器的话,也可以不安装,而是使用内置的html.parser解析器。

windows下安装lxm

在命令行下输入以下命令,就可以成功安装好lxm.当然,有时候会安装出错,所以,最好的方法是去lxml的官网下载对应的lxml版本

pip install lxml


linux下安装lxml

跟windows一样,可以通过使用pip安装

pip install lxml


当然,用ubuntu的源安装更加方便

sudo apt-get install Python-lxml


结语

BeautifulSoup确实是一个不错的文档树分析工具,比较有利于对网页信息的提取。当然,也可以使用正则对网页信息进行提取,不过得水平比较好才行。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python