您的位置：首页 > 编程语言 > Python开发

Python中运用正则表达式抓取网页图片

2015-09-23 21:43 513 查看

#!/usr/bin/python

import re

import urllib

#获取网页信息

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getImg(html):

#匹配网页中的图片

reg = r'src="(.*?\.jpg)" alt'

imgre = re.compile(reg)

imglist = re.findall(imgre,html)

x = 0

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' % x)

x+=1

html = getHtml("http://photo.bitauto.com/?WT.mc_id=360tpdq")

print getImg(html)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python--关于函数传递
Python抓取新闻标题和链接
【Python之旅】第三篇（三）：Python正则表达式
【Python之旅】第三篇（三）：Python正则表达式
Python自动单元测试框架
python教程
python 多线程问题
python连接odbc
Python函数参数中的星号*（关键字参数与非关键字参数）
Python 学习（二） Python中的循环
python属性详解
Python格式字符串
关于Python 资源学习
Python 学习（5）---类的相关知识整理（续）
Python爬虫框架Scrapy获得定向打击批量招聘信息
Python-Django-实例sadmin学习
Python之threading模块简单使用
Python学习笔记
Python代理设置
python

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航