爬虫学习笔记01(问题:Errno 10060)
2017-07-31 16:59
197 查看
1.扒取网页源码,以“http://www.baidu.com”为例
代码如下:
报错如下[Errno 10060]:
2.错误原因:
在办公网下,执行该段代码则会报错,猜测是公司对于外网的访问策略限制导致。
3.解决办法:
通过设置ProxyHandler代理解决,代码如下:
结果(成功)如下:
代码如下:
# *-* coding:utf-8 *-* import urllib2 response = urllib2.urlopen("http://www.baidu.com") print response.read()
报错如下[Errno 10060]:
2.错误原因:
在办公网下,执行该段代码则会报错,猜测是公司对于外网的访问策略限制导致。
3.解决办法:
通过设置ProxyHandler代理解决,代码如下:
# *-* coding:utf-8 *-* import urllib import urllib2 import re # 生成一个字典保存代理地址和端口号 proxy_info = {'host': 'xxxxxxx', 'port': 8083} # ProxyHandler()的入参为键值对,例如:proxy = urllib2.ProxyHandler({'http': '127.0.0.1:8087'}) # ProxyHandler()方法获取一个代理处理程序,实质为一个实例对象 proxy_support = urllib2.ProxyHandler({"http": "http://%(host)s:%(port)d" % proxy_info}) # 使用build_opener()函数创建自定义Opener对象 opener = urllib2.build_opener(proxy_support) # 安装不同的opener对象作为urlopen()使用的全局opener urllib2.install_opener(opener) # 执行urlopen方法之后,返回一个response对象,返回信息便保存在这里面 response = urllib2.urlopen("http://www.baidu.com") print response.read()
结果(成功)如下:
相关文章推荐
- 极客 | Python | 学习笔记01:Python 定向爬虫入门
- cocos2d-x学习笔记番外篇04:开发问题汇总01 推荐
- Python学习笔记:学习爬虫时遇到的问题TypeError: cannot use a string pattern on a bytes-like object 与解决办法
- [知了堂学习笔记] SSM框架项目中遇到的问题及解决办法_01
- 【极客学院】-python学习笔记-3-单线程爬虫 (request安装遇到问题及解决,应用requests提取信息)
- Python学习笔记-List基本操作【python 3】//为继续学习爬虫准备-01
- 算法导论学习笔记(十三):动态规划(三):01背包问题
- python核心编程学习笔记-2016-08-02-01-读取文件的函数中的文件指针问题
- 强化学习笔记01,02——强化学习问题和Multi-arm Bandits
- python数据结构学习笔记-2017-01-08-01-N皇后问题、迷宫问题和跳马问题的递归解决
- jdbc的连接问题-----java数据学习笔记之2
- SpringMVC学习笔记--解决乱码问题
- XSL学习笔记:XSLT优先级问题
- java学习笔记,试用初学者,第二节,关于内存地址分配问题
- asp.net 学习笔记[01] 新控件
- 老友记台词学习笔记 SE01EP01(五)
- 关于asp.net 2.0 入门学习之“GlobalResources与Callback问题”的笔记
- Asp.net 学习笔记01
- C# 学习笔记 (Assembly)-01
- C#设计模式(学习笔记[01])