Python中运用正则表达式抓取网页图片
2015-09-23 21:43
513 查看
#!/usr/bin/python
import re
import urllib
#获取网页信息
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
#匹配网页中的图片
reg = r'src="(.*?\.jpg)" alt'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)
import re
import urllib
#获取网页信息
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
#匹配网页中的图片
reg = r'src="(.*?\.jpg)" alt'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")
print getImg(html)
相关文章推荐
- python--关于函数传递
- Python抓取新闻标题和链接
- 【Python之旅】第三篇(三):Python正则表达式
- 【Python之旅】第三篇(三):Python正则表达式
- Python自动单元测试框架
- python教程
- python 多线程问题
- python连接odbc
- Python函数参数中的星号*(关键字参数与非关键字参数)
- Python 学习 (二) Python中的循环
- python属性详解
- Python格式字符串
- 关于Python 资源学习
- Python 学习(5)---类的相关知识整理(续)
- Python爬虫框架Scrapy获得定向打击批量招聘信息
- Python-Django-实例sadmin学习
- Python之threading模块简单使用
- Python学习笔记
- Python代理设置
- python