您的位置：首页 > 编程语言 > Python开发

【用Python写爬虫】获取html的方法【一】：使用urllib

2008-06-13 16:15 1166 查看

[align=left][/align]

# -*-
coding: UTF-8 -*-
import urllib

'
获取web页面内容并返回'
def getWebPageContent(url):

f = urllib.urlopen(url)

data = f.read()

f.close()
return data

url = 'http://blog.csdn.net'
content =
getWebPageContent(url)
print content

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 职场爬虫蜘蛛休闲 Python

相关文章推荐

【用Python写爬虫】获取html的方法【一】：使用urllib
【用Python写爬虫】获取html的方法【四】：使用urllib下载文件
【用Python写爬虫】获取html的方法【二】：使用pycurl
【用Python写爬虫】获取html的方法【三】：使用cPAMIE
【用Python写爬虫】获取html的方法【五】：利用Twisted框架之client.getPage
【Python3.6爬虫学习记录】（六）urllib详细使用方法(header,代理,超时,认证,异常处理)
[python爬虫]获取html中文乱码时的方法
数据爬虫（二）：python爬虫中urllib库详解,parse和request使用方法
python爬虫学习（一）通过urllib2模块获取html，设置用户代理
python的【爬虫】：使用urllib爬取wiki文章，使用beautifulSoup解析html
Python3学习：urllib的使用方法
Python3.7 爬虫（二）使用 Urllib2 与 BeautifulSoup4 抓取解析网页
Java爬虫学习:使用HtmlUnit获取html页面
Python爬虫项目，获取所有网站上的新闻，并保存到数据库中，解析html网页等(未完待续)
Python新手写出漂亮的爬虫代码1——从html获取信息
python中数据爬虫requests库使用方法详解
Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
python使用threading获取线程函数返回值的实现方法

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航