您的位置：首页 > 编程语言 > Python开发

Python爬虫处理抓取数据中文乱码问题

2016-09-22 14:02 627 查看

乱码原因：

因为你的文件声明为utf-8，并且也应该是用utf-8的编码保存的源文件。但是windows的本地默认编码是cp936，也就是gbk编码，所以在控制台直接打印utf-8的字符串当然是乱码了。

解决方法：

在控制台打印的地方用一个转码就ok了，打印的时候这么写：

print myname.decode('UTF-8').encode('GBK')

比较通用的方法是：

import sys
type = sys.getfilesystemencoding()
print myname.decode('UTF-8').encode(type)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 乱码爬虫 python

相关文章推荐

新的分享

章节导航