您的位置:首页 > 编程语言 > Python开发

Python简单爬取蚂蚁窝首页的图片

2016-12-08 10:50 169 查看
我的第一个python爬虫。

根据博文Python实现简单爬虫功能

import urllib
import urllib2
import re

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImag(html):
reg = r'src="(.+?)"'
imgre = re.compile(reg)
imglist = re.findall(imgre, html)
x = 0
url = "/Users/userName/Desktop/python/"
for imagurl in imglist:
urllib.urlretrieve(imagurl,url+'%s' % x)
x+=1
return imglist
html = getHtml("http://www.mafengwo.cn/")
print getImag(html)


getHtml()方法也可以是这样写

def getHtml(url):
request = urllib2.Request(url)
response = urllib2.urlopen(request)
html = response.read()
return html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python url 图片 html 爬虫