Python的系统管理_07_python_自动下载图片示例
2013-11-27 17:34
507 查看
一个通过正则匹配来下载指定页面图片的示例,
几个可能出错的地方都用print打印出来,可以观察是否正确。
目标站点::http://www.tupian.com/tag/xinggan
#引入数据包
import re
import urllib
#定义获得url中HTML代码的方法。
def getHtml(url):
page=urllib.urlopen(url)
html = page.read()
return html
#获得指定网站的源代码
html =getHtml("http://www.tupian.com/tag/xinggan")
#显示出来查看是否正确。
print html
clear
#正则表达式对比截取图片文件路径
printre.findall(r'src="(.*?\.jpg)"alt',html)
imglist =re.findall(r'src="(.*?\.jpg)"alt',html)
#迭代下载图片,另存为1的叠加
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' %x)
x+=1
几个可能出错的地方都用print打印出来,可以观察是否正确。
目标站点::http://www.tupian.com/tag/xinggan
#引入数据包
import re
import urllib
#定义获得url中HTML代码的方法。
def getHtml(url):
page=urllib.urlopen(url)
html = page.read()
return html
#获得指定网站的源代码
html =getHtml("http://www.tupian.com/tag/xinggan")
#显示出来查看是否正确。
print html
clear
#正则表达式对比截取图片文件路径
printre.findall(r'src="(.*?\.jpg)"alt',html)
imglist =re.findall(r'src="(.*?\.jpg)"alt',html)
#迭代下载图片,另存为1的叠加
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' %x)
x+=1
相关文章推荐
- Python动态类型的学习---引用的理解
- 垃圾邮件过滤器 python简单实现
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- Python中zip()函数用法举例
- Python中map()函数浅析
- Python在CAM软件Genesis2000中的应用
- 使用Shiboken为C++和Qt库创建Python绑定
- [转][源代码]Comex公布JailbreakMe 3.0源代码
- LCL.VBS 病毒源代码
- Python,Flex 2和Aptana[js开放工具]
- 国外开发者谈为何放弃PHP而改用Python
- 利用webqq协议使用python登录qq发消息源码参考
- python 判断自定义对象类型
- 让python的Cookie.py模块支持冒号做key的方法
- Python 面向对象 成员的访问约束