python 抓取的网页数据中文以16进制形式显示如“\x54\76”
2016-10-12 10:48
453 查看
python抓取网页数据后,中文字符以16进制显示,返回的数据如下所示
b'[{"name":"\xe8\x8b\xb9\xe6\x9e\x9c\xe5\x9b\xad","pyName":"PGY","pyfName":"PINGGUOYUAN","englishName":null,"transfer":false}]'
这是因为网页一般采用的时‘utf-8’和‘gbk’编码,对返回结果做‘utf-8’解码处理
url_response = call_http('get', url)
url_response = url_response.decode('utf-8')
结果显示正确
[{"name":"苹果园","pyName":"PGY","pyfName":"PINGGUOYUAN","englishName":null,"transfer":false}]
b'[{"name":"\xe8\x8b\xb9\xe6\x9e\x9c\xe5\x9b\xad","pyName":"PGY","pyfName":"PINGGUOYUAN","englishName":null,"transfer":false}]'
这是因为网页一般采用的时‘utf-8’和‘gbk’编码,对返回结果做‘utf-8’解码处理
url_response = call_http('get', url)
url_response = url_response.decode('utf-8')
结果显示正确
[{"name":"苹果园","pyName":"PGY","pyfName":"PINGGUOYUAN","englishName":null,"transfer":false}]
相关文章推荐
- python抓取中文网页显示乱码问题
- python 解决抓取网页中的中文显示乱码问题
- 利用python3的urllib.request抓取网页内容并显示中文
- python 解决抓取网页中的中文显示乱码问题
- python matplotlib plot 数据中的中文无法正常显示的解决办法
- 用python进行分布式网页数据抓取(一)——设计
- python 网页抓取中的中文乱码问题解决
- Python抓取中文网页
- (转)如何用python抓取网页并提取数据
- 获取一个网页数据返回的编码类型是gzip,解压后,网页中包含的中文字段变成了乱码,只需要把编码更改为BIG5 ,繁体字就正常显示了!
- 用python进行分布式网页数据抓取(三)—— 编码实现
- python 打印json格式的数据中文显示问题
- Windows下Python抓取网页中文乱码解决办法
- 一个极其简洁的Python网页抓取程序,自己主动从雅虎財经抓取股票数据
- 学习笔记-python抓取网页数据
- 一个极其简洁的Python网页抓取程序,自动从雅虎财经抓取股票数据
- 用python3抓取中文网页
- [CPyUG] 抓取网页数据时遇到的中文编码问题
- 参照《鲜活的数据:数据可视化指南》第2章:抓取网页数据(历史天气记录)的Python程序
- Python抓取中文网页出现乱码