python3 使用urllib.request模块,关于bytes和string的那些事
2015-03-26 14:22
726 查看
python 3.4.2 使用urllib.request模块获取网页内容,虽说知道要注意编解码的问题,但有些细节还是不清楚,终于碰到了TypeError的错误:
知道是字节和字符使用错误,但是问题在哪儿呢?只好敲代码问问了。
page 的类型是: bytes
the_page 的类型是: string
b_page 的类型是: bytes
知道了这些细节,修改代码bug就很简单了。
TypeError:can't use a string pattern on a bytes-like object
知道是字节和字符使用错误,但是问题在哪儿呢?只好敲代码问问了。
import urllib.request url = 'http://www.baidu.com' req = urllib.request.Request(url) response = req.urlopen(req) page = response.read() the_page = page.decode("UTF-8") b_page = the_page.encode("UTF-8")
page 的类型是: bytes
the_page 的类型是: string
b_page 的类型是: bytes
知道了这些细节,修改代码bug就很简单了。
相关文章推荐
- [python]-urllib2和urllib模块使用
- python使用urllib模块和pyquery实现阿里巴巴排名查询
- 在python3中使用urllib.request编写简单的网络爬虫
- 使用Python的urllib和urllib2模块制作爬虫的实例教程
- Python中关于使用模块的基础知识
- 关于使用request.querystring提取中文数据的问题
- 关于python中使用mongodb模块,save和insert的小问题
- python urllib2模块使用方法总结
- 在python3中使用urllib.request编写简单的网络爬虫
- Python中关于模块的 '__name__' 变量的使用
- python使用urllib2模块获取gravatar头像实例
- Python中urllib2模块的8个使用细节分享
- python使用urllib2模块获取gravatar头像实例
- Python中的urllib模块使用详解
- 关于使用python logging模块的几点总结
- python使用urllib模块开发的多线程豆瓣小站mp3下载器
- Python使用urllib模块的urlopen超时问题解决方法
- Python中urllib2模块的8个使用细节分享
- Python中使用urllib2模块编写爬虫的简单上手示例
- 关于Request.QueryString中网站中的使用