您的位置:首页 > 编程语言 > Python开发

Python_爬虫

2016-05-06 02:06 363 查看
1、网页下载器和urllib2模块...

=================

1、网页解析器:

   正则表达式:字符串模糊匹配

   html.parser:

   Beautiful Soup:

   lxml:

   除正则表达式外,都是采用结构化-DOM进行解析。

   课程推荐:Beautiful Soup

   

2、网页解析器-Beautiful Soup

   -Python第三方库,用于从HTML或XML中提取数据

   -官网:http://www.crummy.com/software/BeautifulSoup/

   

   安装:pip install beautifulsoup4  

================================================


数据专家必知必会的 7 款 Python 工具

:http://www.imooc.com/article/3159
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python