您的位置：首页 > Web前端 > HTML

Python 爬取网页HTML代码

2016-09-29 19:43 323 查看

#/usr/bin/env python
#-*- coding:utf-8 -*-

import urllib2
import sys
import chardet

req = urllib2.Request("http://tycool.top/")
content = urllib2.urlopen(req).read()
typeEncode = sys.getfilesystemencoding()##系统默认编码
infoencode = chardet.detect(content).get('encoding','utf-8')##通过第3方模块来自动提取网页的编码
html = content.decode(infoencode,'ignore').encode(typeEncode)##先转换成unicode编码，然后转换系统编码输出
print html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python学习之----初见网络爬虫（输出整个网页html的代码）
将RTF格式的文件转成HTML并在网页中显示的代码
非常用的着的HTML标签，为代码网页减肥！
网页标准中HTML，CSS，JS，ASP等代码注释方法
[VB.NET]VB.NET中如何向网页提交一个请求,并得到返回的HTML代码?
HTML 事件与属性,网页设计中常用的CSS属性,HTML ASCII 代码参考手册
C#如何读取post方式的网页的HTML代码？
Webapp架构中的HTML里面嵌套的Python语句的for遍历代码，在结束的时候一定要有{{endfor}}
vb.net下载网页html代码
一款可以用来实现网页拖拽得HTML代码
Python将Delphi代码生成语法高亮的HTML格式
ASP动态网页生成静态Html网页代码
网页中运行其它html代码
表达式从网页html代码中提取图片的scr地址!
网页html代码的查看
将RTF格式的文件转成HTML并在网页中显示的代码
获取网页HTML代码[转]
ASP.NET获取任意网页HTML代码
一段网页上自动播放视频的Html代码【非常好用】
无聊时批量查高考成绩的代码 - 用代码控制html网页

新的分享

Html简单标签
HTML表单
仿京东商城html网页源码
HTML行内级元素之间的空格问题
HTML元素类型总结
HTML怎么设置下划线?html文字加下划线方法
HTML汉字编码标准介绍
html网页中使用希腊字母的方法
HTML基础详解(上)
HTML基础详解（下）
基于HTML十秒做出淘宝页面
【Python】300行代码搞定HTML模板渲染

章节导航