python爬虫:unicode编码的url如何正确解码
2019-04-21 14:04
555 查看
python爬虫的时候,有时候会遇到类似于 https://detail.tmall.com/item.htm?id\u003d567018911496\u0026ns\u003d1\u0026abbucket\u003d8
这样的url,该如何正确解码呢,参看知乎大牛的解决方法:
“https://detail.tmall.com/item.htm?id\u003d567018911496\u0026ns\u003d1\u0026abbucket\u003d8”.encode(“latin-1”).decode(“unicode_escape”)
结果
https://detail.tmall.com/item.htm?id=567018911496&ns=1&abbucket=8
相关文章推荐
- Python3中编码与解码之Unicode与bytes的讲解
- [置顶] 【python 爬虫】python中url链接编码处理方法
- python编码解码unicode
- python语言如何正确使用亿牛云爬虫代理
- python:正确的对未知编码的字符串进行预处理-Unicode-UTF8-gbk
- URL如何编码与解码
- Python接口自动化--URL参数的编码和解码 6
- Python编码UNICODE GBK UTF-8字符集转换的正确姿势
- python对URL的编码和解码
- Scrapy爬虫,Python2将Unicode编码装换成UTF-8编码解决方法之一
- java中编码与解码分别指什么? 如何向非技术人员解释 Unicode 是什么?
- python爬虫之请求(url)构造 —— 寻找参数来源以及中文编码
- python中对URL的编码与解码
- python unicode 及解码编码方式简介
- 【整理】Python中实际上已经得到了正确的Unicode或某种编码的字符,但是看起来或打印出来却是乱码
- Scrapy爬虫框架抓取中文结果为Unicode编码,如何转换UTF-8编码的解决办法
- python3中编码与解码之Unicode与bytes
- 【Python小白】向PyPI上传代码出现问题,报401或者410如何解决(主要是上传的URL不正确)!
- JavaScript如何正确处理Unicode编码问题!
- Python3编码解码url