您的位置:首页 > 编程语言 > Python开发

[置顶] 【python 爬虫】python中url链接编码处理方法

2017-08-27 10:57 686 查看
一、问题描述

有些网址,会把中文编码成gb2312格式,例如百度知道,美容这一词,网址上面会编码成:

%C3%C0%C8%DD


那么如何生成这种编码呢?

二、解决方法

1、把要编码的文字encode成所需格式

2、利用urllib 库的quote方法编码

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

key=str("美容").decode('utf-8').encode('gb2312')
import urllib
m1=urllib.quote(key)
print m1


D:\Python27\python.exe F:/PycharmProjects/url编码.py
%C3%C0%C8%DD

Process finished with exit code 0
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: