[置顶] 【python 爬虫】python中url链接编码处理方法
2017-08-27 10:57
686 查看
一、问题描述
有些网址,会把中文编码成gb2312格式,例如百度知道,美容这一词,网址上面会编码成:
那么如何生成这种编码呢?
二、解决方法
1、把要编码的文字encode成所需格式
2、利用urllib 库的quote方法编码
有些网址,会把中文编码成gb2312格式,例如百度知道,美容这一词,网址上面会编码成:
%C3%C0%C8%DD
那么如何生成这种编码呢?
二、解决方法
1、把要编码的文字encode成所需格式
2、利用urllib 库的quote方法编码
# -*- coding:utf-8*- import sys reload(sys) sys.setdefaultencoding('utf-8') key=str("美容").decode('utf-8').encode('gb2312') import urllib m1=urllib.quote(key) print m1
D:\Python27\python.exe F:/PycharmProjects/url编码.py %C3%C0%C8%DD Process finished with exit code 0
相关文章推荐
- 基于python 爬虫爬到含空格的url的处理方法
- 中文编码相关,python处理gbk编码的xml文件方法
- Python爬虫判断url链接的是下载文件还是html文件
- 使用Python生成url短链接的方法
- python中读写文件及中文编码处理方法
- JAVA中URL链接中文参数乱码处理方法
- Android笔记之1:对URL链接汉字的编码处理
- python处理url中的中文编码,以及其他编码问题
- 详解Python中使用base64模块来处理base64编码的方法
- 获取当前页面的所有链接的四种方法对比(python 爬虫)
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- 详解Python中使用base64模块来处理base64编码的方法
- [置顶] Python语言处理整个文件的base64编码解码源码共享
- JSP对URL链接中的中文乱码处理方法总结
- 中文编码相关,python处理gbk编码的xml文件方法
- 使用Python生成url短链接的方法
- [记录]Python爬虫过程中遇到的简单带干扰线验证码处理方法
- Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
- URL链接中文参数乱码的若干处理方法
- python爬虫中对含中文的url处理