Python 爬取网页HTML代码
2016-09-29 19:43
323 查看
#/usr/bin/env python #-*- coding:utf-8 -*- import urllib2 import sys import chardet req = urllib2.Request("http://tycool.top/") content = urllib2.urlopen(req).read() typeEncode = sys.getfilesystemencoding()##系统默认编码 infoencode = chardet.detect(content).get('encoding','utf-8')##通过第3方模块来自动提取网页的编码 html = content.decode(infoencode,'ignore').encode(typeEncode)##先转换成unicode编码,然后转换系统编码输出 print html
相关文章推荐
- python学习之----初见网络爬虫(输出整个网页html的代码)
- 将RTF格式的文件转成HTML并在网页中显示的代码
- 非常用的着的HTML标签,为代码网页减肥!
- 网页标准中HTML,CSS,JS,ASP等代码注释方法
- [VB.NET]VB.NET中如何向网页提交一个请求,并得到返回的HTML代码?
- HTML 事件与属性,网页设计中常用的CSS属性,HTML ASCII 代码参考手册
- C#如何读取post方式的网页的HTML代码?
- Webapp架构中的HTML里面嵌套的Python语句的for遍历代码,在结束的时候一定要有{{endfor}}
- vb.net下载网页html代码
- 一款可以用来实现网页拖拽得HTML代码
- Python将Delphi代码生成语法高亮的HTML格式
- ASP动态网页生成静态Html网页代码
- 网页中运行其它html代码
- 表达式从网页html代码中提取图片的scr地址!
- 网页html代码的查看
- 将RTF格式的文件转成HTML并在网页中显示的代码
- 获取网页HTML代码[转]
- ASP.NET获取任意网页HTML代码
- 一段网页上自动播放视频的Html代码【非常好用】
- 无聊时批量查高考成绩的代码 - 用代码控制html网页