使用urllib2解析html内容,并正常显示中文的方法
2013-10-31 17:30
597 查看
获得目标html的编码格式
按照此编码格式去解析html内容,就可以正常解析
import urllib2
target = urllib2.urlopen("http://www.amazon.cn")
print target.hearders #或使用target.info(),获得charset的内容为:utf-8
content=target.read().decode("utf-8") #此处对内容进行utf-8格式解码,否则print时会输出乱码
print content #正确解码,显示正常中文
按照此编码格式去解析html内容,就可以正常解析
import urllib2
target = urllib2.urlopen("http://www.amazon.cn")
print target.hearders #或使用target.info(),获得charset的内容为:utf-8
content=target.read().decode("utf-8") #此处对内容进行utf-8格式解码,否则print时会输出乱码
print content #正确解码,显示正常中文
相关文章推荐
- 使用urllib2解析html内容,并正常显示中文的方法 分类: python Module 2013-10-31 17:30 294人阅读 评论(0) 收藏
- 使用PHP向Mysql数据库插入信息,页面中文内容显示正常,但在数据库里却是乱码,这个怎么解决?
- jQuery html()方法使用不了无法显示内容的问题
- 使用Jsoup解析Html == TextView显示html图片的方法
- 解决在使用flask时向网页中插入一段包含html标签的内容正常显示的问题
- html编写代码时,显示效果中文内容出现乱码解决方法
- 微信小程序使用wxParse解析html的方法教程
- SetACL 使用方法详细参数中文解析
- 在使用Gson的toJson()方法转为json字符串的时候无法显示中文和符号的问题(已解决)
- Java Map集合使用方法介绍(1)——在字典中添加内容并显示
- Outlook 2007不再使用IE来解析HTML/GIF,只能显示GIF图像的第一帧。
- jQuery html()方法使用不了无法显示内容的问题
- 使用xhtmlrenderer把html转换为PDF后右侧内容不显示
- python的【爬虫】:使用urllib爬取wiki文章,使用beautifulSoup解析html
- 使用jsoup解析html页面内容案例
- html/jsp中文显示乱码解决方法
- Vue中使用Froala Editor时,外部方法调用html.insert()插入内容到光标最后停留位置功能实现
- 将Html原码解析成IHTMLDocumet对象,然后使用DOMNode将html显示成一棵树
- python 实现将字典dict、列表list中的中文正常显示方法
- 微信小程序中显示html格式内容的方法