python使用代理服务器获取网页数据
2018-02-02 18:53
316 查看
免费代理ip网址:http://www.xicidaili.com/
多次重复获取网页时,很容易被网站的反扒封掉ip,这时可以使用代理,python使用代理非常简单,三行代码即可实现。
完整代码如下:
多次重复获取网页时,很容易被网站的反扒封掉ip,这时可以使用代理,python使用代理非常简单,三行代码即可实现。
#使用urllib库的ProxyHandler添加代理ip地址。proxy_add为要添加的ip地址,:端口即可 proxy = urllib.request.ProxyHandler({'http':proxy_add}) #建立ip地址,其中第二个参数为固定 opener = urllib.request.build_opener(proxy,urllib.request.HTTPHandler) 将opener设置为全局变量,这样才能接下来使用urllib.request时携带此ip urllib.request.install_opener(opener)
完整代码如下:
#代理服务器ip地址获取网页 import urllib.request import urllib.error #定义函数,第一个参数为要获取的网页,第二个参数为代理的ip地址 def daili(url,proxy_add): header = { 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' }#添加浏览器头部 proxy = urllib.request.ProxyHandler({'http':proxy_add})#添加ip代理 opener = urllib.request.build_opener(proxy,urllib.request.HTTPHandler)#建立代理ip,第二个参数为固定 #opener.addheader = [header] urllib.request.install_opener(opener)#将opener安装为全局,再次使用urllib.request时,均带有代理ip try:#使用try,except获取可能发生的异常 request = urllib.request.Request(url,headers=header)#使用Request在请求时传入一些数据 except urllib.error.URLError as e: if hasattr(e,'code'): print(e.code) if hasattr(e,'reason'): print(e.reason) data = urllib.request.urlopen(request).read() f = open('/Users/wangxingfan/Desktop/1/12.html','wb') f.write(data) f.close() url = 'http://www.163.com' proxy_add = '218.13.11.186:8118' daili(url,proxy_add)
相关文章推荐
- 使用python获取网页中指定数据
- 使用libcurl 函数库获取网页数据代码
- 一个简单的使用python抓取网页中的水文数据的程序
- Html网页使用jQuery传递参数并获取Web API的数据
- Python抓取网页动态数据——selenium webdriver的使用
- 使用python获取webservice数据并输出到文件
- python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
- HttpURLConnection连接网页和获取数据的使用实例
- Python使用xslt提取网页数据
- Python中使用PhantomJS抓取Javascript网页数据
- 使用HttpWebRequest访问网页及获取数据
- 使用python urllib2获取网页信息
- Python 爬虫 正则抽取网页数据和Scrapy简单使用
- python数据库操作常用功能使用详解(创建表/插入数据/获取数据)
- PHP使用CURL函数获取HTTPS网页及POST数据示例
- 使用python获取mongodb一段时间的数据
- Android登录客户端,验证码的获取,网页数据抓取与解析,HttpWatch基本使用
- C++使用POST方法向网页提交数据-----C++发送HTTP数据获取Google天气预报
- 从php获取json数据使用js读取显示到网页笔记
- java使用代理服务器获取网页脚本