您的位置:首页 > 产品设计 > UI/UE

关于用Requests模块页面编码的相关

2015-06-26 00:14 585 查看
利用Requests模块获取到目标页面后,先观察该页面的编码:

req = requests.request('GET', url)
print req.encoding

当这个编码与你的IDE的编码相同的时候,才不会乱码。
一般文件都是utf8的格式。

我的PyCharm是encoding设置的是utf8格式,所以当我请求百度首页后,返回的页面可以直接通过req.text显示,无乱码。

而我然后又请求了一个页面,该页面的encoding是ISO-8859-1的,所以显示乱码,这时候要使得页面的编码符合你IDE的编码格式,所以修改页面的编码为utf-8才能不乱码:

req.encoding='utf-8'

然后再:
print req.text
才不是乱码。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: