Python2设置用户代理User Agent访问网页
2017-08-26 19:46
465 查看
一,概念
User Agent用户代理,是一个标志,供服务端识别客户端的操作系统和浏览器情况。比如,如果想判断访问网站的浏览器是否是微信浏览器,就可以判断用户代理,来实现网页仅能从微信自带浏览器访问。
另外,如果使用urllib2默认的代理字符串,可能会被某些网站屏蔽(不想被通过代码访问)。
二,在python中设置代理
代码如下:#!/usr/bin/python2.7 # coding=UTF-8 import urllib2 #变量区域 url="http://www.baidu.com/"#待下载的网址 #方法区域 def downloadWebsite(url,retry_time=5,user_agent="temp"): print("start to download:"+url+",the retry time is:"+str(retry_time)) header={"User-Agent:":user_agent} request=urllib2.Request(url,headers=header) try: result=urllib2.urlopen(url).read() except urllib2.URLError as ex: if retry_time==1: return "download error,the reason is:"+ex.reason+",error code"+str(ex.code) else: return downloadWebsite(url,retry_time-1) return result result=downloadWebsite(url) print(result)
三,更多设置
下面是一个通过Firefox浏览器查看的请求头情况,可见Linux和Firefox字样。根据上面的代码header={"User-Agent:":user_agent} request=urllib2.Request(url,headers=header),我们应该可以修改其他请求头的信息。
相关文章推荐
- Python 设置 IP 代理 访问网页 ( 用户名密码验证代理 )
- python]用urllib2设置代理访问网页
- Python3中使用代理访问网页
- java程序访问网页,需要的代理设置
- C#设置IE代理和使用代理访问网页
- python selenium Frefox使 用代理访问网页
- python爬虫学习(一)通过urllib2模块获取html,设置用户代理
- HttpComponents(Apache HttpComponents Client 4.1.3)通过代理访问网页的设置方法
- python3.0学习七: 用代理访问网页
- [python]通过urllib2设置代理访问网址
- 一、MongoDB为用户设置访问权限
- python 添加用户设置密码并发邮件给root用户
- JS获取浏览器UA(User Agent 用户代理)方法
- php实现获取及设置用户访问页面语言类
- C# webBrowser 通过代理访问网页
- TCP三次握手和四次挥手及用户访问网页流程
- Win8系统分配访问限制用户使用范围的设置技巧
- 为用户设置多条目录访问规则
- MongoDB设置访问权限、设置用户
- python 设置代理