您的位置：首页 > Web前端 > HTML

使用urllib2解析html内容，并正常显示中文的方法

2013-10-31 17:30 597 查看

获得目标html的编码格式
按照此编码格式去解析html内容，就可以正常解析

import urllib2
target = urllib2.urlopen("http://www.amazon.cn")
print target.hearders #或使用target.info()，获得charset的内容为：utf-8
content=target.read().decode("utf-8") #此处对内容进行utf-8格式解码，否则print时会输出乱码
print content #正确解码，显示正常中文

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

使用urllib2解析html内容，并正常显示中文的方法分类： python Module 2013-10-31 17:30 294人阅读评论(0) 收藏
使用PHP向Mysql数据库插入信息，页面中文内容显示正常，但在数据库里却是乱码，这个怎么解决？
jQuery html()方法使用不了无法显示内容的问题
使用Jsoup解析Html == TextView显示html图片的方法
解决在使用flask时向网页中插入一段包含html标签的内容正常显示的问题
html编写代码时，显示效果中文内容出现乱码解决方法
微信小程序使用wxParse解析html的方法教程
SetACL 使用方法详细参数中文解析
在使用Gson的toJson()方法转为json字符串的时候无法显示中文和符号的问题（已解决）
Java Map集合使用方法介绍（1）——在字典中添加内容并显示
Outlook 2007不再使用IE来解析HTML/GIF，只能显示GIF图像的第一帧。
jQuery html()方法使用不了无法显示内容的问题
使用xhtmlrenderer把html转换为PDF后右侧内容不显示
python的【爬虫】：使用urllib爬取wiki文章，使用beautifulSoup解析html
使用jsoup解析html页面内容案例
html/jsp中文显示乱码解决方法
Vue中使用Froala Editor时，外部方法调用html.insert()插入内容到光标最后停留位置功能实现
将Html原码解析成IHTMLDocumet对象,然后使用DOMNode将html显示成一棵树
python 实现将字典dict、列表list中的中文正常显示方法
微信小程序中显示html格式内容的方法

新的分享

Html简单标签
HTML表单
仿京东商城html网页源码
HTML行内级元素之间的空格问题
HTML元素类型总结
HTML怎么设置下划线?html文字加下划线方法
HTML汉字编码标准介绍
html网页中使用希腊字母的方法
HTML基础详解(上)
HTML基础详解（下）
基于HTML十秒做出淘宝页面
【Python】300行代码搞定HTML模板渲染

章节导航