(一)BeautifulSoup的安装
2016-03-26 21:41
471 查看
一.BeautifulSoup的安装
windows下的安装
确保必要的工作(已经安装好python和pip)一般在官网下载最新的python时,已经回默认安装好pip了,只要在选择的时候勾选添加到环境变量,就不需要自己手动的设置环境变量。
运行cmd,在命令行中输入一下命令即可安装成功。
pip install BeautifulSoup4
linux下的安装
由于本人使用的是ubuntu,即主要讲解的是ubuntu下的安装,其实其他发行版本的安装都是差不多的。安装python
由于在ubuntu的发行版本中已经自带有python,即可以略过这一步
安装pip
默认是没有安装pip的,打开shell,输入一下命令即可安装pip,此方法比较方便快捷。
sudo apt-get install python-pip
BeautifulSoup安装
由于BeautifulSoup已经集成到了ubuntu的源中,所以,可以直接运行一下命令直接安装(用这个方法可以跳过第二步pip的安装)
sudo apt-get install Python-bs4
或者使用如windows下的安装方式(第二步必须安装成功,推荐使用上一种方式,简单快捷不易出错)
pip install beautifulSoup4
二.解析器的安装
由于BeautifulSoup4支持多种解析器,但其中,lxml的解析速度比较快的,所以,必须安装lxml解析器。当然,如果觉得不需要lxml解析器的话,也可以不安装,而是使用内置的html.parser解析器。windows下安装lxm
在命令行下输入以下命令,就可以成功安装好lxm.当然,有时候会安装出错,所以,最好的方法是去lxml的官网下载对应的lxml版本pip install lxml
linux下安装lxml
跟windows一样,可以通过使用pip安装pip install lxml
当然,用ubuntu的源安装更加方便
sudo apt-get install Python-lxml
结语
BeautifulSoup确实是一个不错的文档树分析工具,比较有利于对网页信息的提取。当然,也可以使用正则对网页信息进行提取,不过得水平比较好才行。相关文章推荐
- Python动态类型的学习---引用的理解
- Python3写爬虫(四)多线程实现数据爬取
- 垃圾邮件过滤器 python简单实现
- 下载并遍历 names.txt 文件,输出长度最长的回文人名。
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- Python中zip()函数用法举例
- Python中map()函数浅析
- Python将excel导入到mysql中
- Python在CAM软件Genesis2000中的应用
- 使用Shiboken为C++和Qt库创建Python绑定
- FREEBASIC 编译可被python调用的dll函数示例
- Python 七步捉虫法