【用Python写爬虫】获取html的方法【一】:使用urllib
2008-06-13 16:15
1166 查看
[align=left][/align]
# -*-
coding: UTF-8 -*-
import urllib
'
获取web页面内容并返回'
def getWebPageContent(url):
f = urllib.urlopen(url)
data = f.read()
f.close()
return data
url = 'http://blog.csdn.net'
content =
getWebPageContent(url)
print content
# -*-
coding: UTF-8 -*-
import urllib
'
获取web页面内容并返回'
def getWebPageContent(url):
f = urllib.urlopen(url)
data = f.read()
f.close()
return data
url = 'http://blog.csdn.net'
content =
getWebPageContent(url)
print content
相关文章推荐
- 【用Python写爬虫】获取html的方法【一】:使用urllib
- 【用Python写爬虫】获取html的方法【四】:使用urllib下载文件
- 【用Python写爬虫】获取html的方法【二】:使用pycurl
- 【用Python写爬虫】获取html的方法【三】:使用cPAMIE
- 【用Python写爬虫】获取html的方法【五】:利用Twisted框架之client.getPage
- 【Python3.6爬虫学习记录】(六)urllib详细使用方法(header,代理,超时,认证,异常处理)
- [python爬虫]获取html中文乱码时的方法
- 数据爬虫(二):python爬虫中urllib库详解,parse和request使用方法
- python爬虫学习(一)通过urllib2模块获取html,设置用户代理
- python的【爬虫】:使用urllib爬取wiki文章,使用beautifulSoup解析html
- Python3学习:urllib的使用方法
- Python3.7 爬虫(二)使用 Urllib2 与 BeautifulSoup4 抓取解析网页
- Java爬虫学习:使用HtmlUnit获取html页面
- Python爬虫项目,获取所有网站上的新闻,并保存到数据库中,解析html网页等(未完待续)
- Python新手写出漂亮的爬虫代码1——从html获取信息
- python中数据爬虫requests库使用方法详解
- Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
- python使用threading获取线程函数返回值的实现方法