您的位置：首页 > 编程语言 > Python开发

[置顶] 【python 爬虫】python中url链接编码处理方法

2017-08-27 10:57 686 查看

一、问题描述

有些网址，会把中文编码成gb2312格式，例如百度知道，美容这一词，网址上面会编码成：

%C3%C0%C8%DD

那么如何生成这种编码呢？

二、解决方法

1、把要编码的文字encode成所需格式

2、利用urllib 库的quote方法编码

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

key=str("美容").decode('utf-8').encode('gb2312')
import urllib
m1=urllib.quote(key)
print m1

D:\Python27\python.exe F:/PycharmProjects/url编码.py
%C3%C0%C8%DD

Process finished with exit code 0

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

基于python 爬虫爬到含空格的url的处理方法
中文编码相关，python处理gbk编码的xml文件方法
Python爬虫判断url链接的是下载文件还是html文件
使用Python生成url短链接的方法
python中读写文件及中文编码处理方法
JAVA中URL链接中文参数乱码处理方法
Android笔记之1：对URL链接汉字的编码处理
python处理url中的中文编码，以及其他编码问题
详解Python中使用base64模块来处理base64编码的方法
获取当前页面的所有链接的四种方法对比（python 爬虫）
Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接，并下载这些URL链接的源代码
详解Python中使用base64模块来处理base64编码的方法
[置顶] Python语言处理整个文件的base64编码解码源码共享
JSP对URL链接中的中文乱码处理方法总结
中文编码相关，python处理gbk编码的xml文件方法
使用Python生成url短链接的方法
[记录]Python爬虫过程中遇到的简单带干扰线验证码处理方法
Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
URL链接中文参数乱码的若干处理方法
python爬虫中对含中文的url处理

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航