PYTHON 爬虫错误总结
2018-03-21 16:22
169 查看
一、urlopen()、urlretrieve()、urlencode()报错:主要是python3和python2版本不同造成的
其中'urlopen', 'urlparse','urlretrieve','urlsplit','urlunparse',属于request子模块,
'urlencode', 'urljoin','urlparse','urlsplit','urlunparse','urlunsplit',属于parse子模块。两个模块中有相同的函数。1、import urllib.request
2、s = urllib.request.urlopen(url)二、'HTTPMessage' object has no attribute 'getheader'1、使用get()接口
2、s = urllib.request.urlopen(url)
msg = s.info() #get a message object
print(msg.get("Content-Type"))三、对于解析不再使用urlparse_qs()而是parse_qs()
四、html解析器在html.parser模块中HTMLParser
其中'urlopen', 'urlparse','urlretrieve','urlsplit','urlunparse',属于request子模块,
'urlencode', 'urljoin','urlparse','urlsplit','urlunparse','urlunsplit',属于parse子模块。两个模块中有相同的函数。1、import urllib.request
2、s = urllib.request.urlopen(url)二、'HTTPMessage' object has no attribute 'getheader'1、使用get()接口
2、s = urllib.request.urlopen(url)
msg = s.info() #get a message object
print(msg.get("Content-Type"))三、对于解析不再使用urlparse_qs()而是parse_qs()
四、html解析器在html.parser模块中HTMLParser
相关文章推荐
- python错误和异常--总结笔记
- Python 3.x爬虫技巧总结
- 学习python的错误总结
- Python错误总结
- C/C++实战常见错误总结及注意事项【关注与Python的不同点】
- 用python爬虫抓站的一些技巧总结
- 【python】linux下自制简易爬虫开发总结(持续更新中)
- python解决网站的反爬虫策略总结
- [Python] 网络爬虫和正则表达式学习总结
- Python爬虫系列(一)初期学习爬虫的拾遗与总结
- python爬虫(爬取蜂鸟网高像素图片)_空网页,错误处理
- python3.6爬虫总结-01
- 用python爬虫抓站的一些技巧总结
- Python之一些常用的爬虫技巧总结
- 转载-Python爬虫之模拟登录总结
- Python爬虫/文本处理/科学计算/机器学习——工具包总结
- 一些常用的python爬虫技巧总结【文末彩蛋福利】
- 总结python爬虫抓站的实用技巧
- Python3环境安装Scrapy爬虫框架过程及常见错误
- python 爬虫 (错误很多)