2.爬虫之urllib2库的基本使用
2018-09-11 17:30
78 查看
爬虫之urllib2库的基本使用
所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。在python中有很多库可以用来抓取网页。
urllib2是python2.7自带的模块(不需要下载,导入即可使用)
urllib2官方文档:https://docs.python.org/2/library/urllib2.html
urllib2源码:https://hg.python.org/cpython/file/2.7/Lib/urllib2.py
注意:urllib2在python3..x中被改为urllib.request
urlopen
python自带的模块:/usr/lib/python2.7/urllib2.py
python第三方模块:use/local/lib/python2.7/user
用urllib爬取网页。
方法一:
以下代码使用的是python 3.6版本。
方法二:
用浏览器看控制台方法:
右键选择“检查”,然后选择“network”,再刷新页面,看name和headers.
爬取页面必须写User-Agent。
阅读更多
相关文章推荐
- 03—小白学Python爬虫之urllib的基本和进阶使用及Get、Post示例
- [Python] - 爬虫之Urllib库的基本使用
- Python爬虫入门之Urllib库的基本使用 (三)
- Python爬虫学习--urllib的基本使用笔记
- 学习爬虫基础3-urllib2库的基本使用
- Python爬虫入门之Urllib库的基本使用
- Python爬虫之Urllib库的基本使用
- Python爬虫入门一之Urllib库的基本使用
- Python之路:爬虫之urllib库的基本使用和高级使用
- python爬虫(四)_urllib2库的基本使用
- Python3.7 爬虫(一)使用 Urllib2 与正则表达式抓取
- 在python3中使用urllib.request编写简单的网络爬虫
- python爬虫urllib使用B
- 运维学python之爬虫基础篇(二)urllib模块使用
- Python爬虫学习(1): urllib的使用
- python 爬虫开发所需基础知识 - urllib库的基本使用
- python3使用urllib模块制作网络爬虫
- Python爬虫之urllib简单使用
- python爬虫从入门到放弃(三)之 Urllib库的基本使用
- 使用PHP创建基本的爬虫程序【转】