您的位置：首页 > 编程语言 > Python开发

python写个图片爬虫

2016-03-25 08:50 483 查看

[root@MGServer pythonscript]# vim getimg.py
#!/usr/bin/python
#encoding:utf8
import requests,sys,re
#定义一个方法，获取网站图片，并下载
def getimg(url):
#请求url内容
page=requests.get(url)
#获取内容
pagetext=page.content
#定义正则表达式。
reg=r'src=.*?\.jpg'
#对获取的内容进行匹配
imglist=re.findall(reg,pagetext)
#为保存的图片文件命名
imgname=1
#循环获取带有src的url地址列表
for x in imglist:
#删除url中的前面src=字段
x=x.lstrip('src="')
try:
#下载图片
img=requests.get(x)
#打开文件，由于imgname是用int递增，所以要使用str把imgname变成str。
of=open('/root/'+str(imgname)+".jpg",'wb')
#保存文件
of.write(img.content)
#关闭文件打开操作
of.close()
#文件名递增
imgname+=1
except IOError,e:
print "url is error:"+str(e)
#sys.exit(1)
#发生错误忽略
pass
#执行定义的函数
getimg(sys.argv[1])
执行方法：
python getimg.py http://www.163.com

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 爬虫 requests pthon

相关文章推荐

新的分享

章节导航