python访问网页返回503错误
2017-08-26 18:34
309 查看
Traceback (most recent call last): File "test.py", line 30, in <module> gethtml() File "test.py", line 13, in scanurl src = urllib2.urlopen(url).read() File "/usr/lib/python2.6/urllib2.py", line 126, in urlopen return _opener.open(url, data, timeout) File "/usr/lib/python2.6/urllib2.py", line 397, in open response = meth(req, response) File "/usr/lib/python2.6/urllib2.py", line 510, in http_response 'http', request, response, code, msg, hdrs) File "/usr/lib/python2.6/urllib2.py", line 435, in error return self._call_chain(*args) File "/usr/lib/python2.6/urllib2.py", line 369, in _call_chain result = func(*args) File "/usr/lib/python2.6/urllib2.py", line 518, in http_error_default raise HTTPError(req.get_full_url(), code, msg, hdrs, fp) urllib2.HTTPError: HTTP Error 503: Service Temporarily Unavailable1、若浏览器能打开响应网页,则是你的访问头header有问题,修改header或者采用我这一篇文章的方法(python获取代理(终极版本)),多个header随即使用
2、若浏览器也打不开,则一般会有两种可能,第一种是对方服务器被动式拒绝服务,比如对方服务器瘫痪,网络问题等,一般很快会被修复。第二种主动式拒绝服务,有可能是因为你短时间内多次访问服务器(一般爬虫会遇到这个问题),这种情况就要看对方服务器的拉黑时间,像我,之前被拉黑过12小时的。
最后说一句:时代在进步,爬虫最少也要用个代理,不要裸奔,这样很容易被“捉奸在床”的啦....
相关文章推荐
- Python中如何获得访问网页所返回的cookie
- 通过python多线程访问网页
- Python绝技笔记--------FTP匿名访问检测、用户名密码爆破、扫描是否存在web服务默认网页
- 访问网页时提示的503错误信息在IIS中怎么设置
- python访问百度地图接口并返回信息
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- Python3中使用代理访问网页
- 编写Python程序访问需要cookie的网页
- Python 设置 IP 代理 访问网页 ( 用户名密码验证代理 )
- python selenium Frefox使 用代理访问网页
- 使用python标准库urllib2访问网页
- python]用urllib2设置代理访问网页
- Eclipse中正常启动Tomcat,但是访问网页返回404
- python访问抓取网页常用命令总结
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- Python定时返回网址状态码&&网页内容是否为json数据
- 使用python访问网页
- 使用Python访问并下载网页内容
- Selenium-Webdriver(python) (五) --- 电脑模拟手机访问手机版网页
- 使用python抓取有道词典的网页并返回结果信息