python网络爬虫抓取图片
2015-06-02 14:34
309 查看
http://blog.csdn.net/longshengguoji/article/details/9946675
利用python抓取网络图片的步骤:
1.根据给定的网址获取网页源代码
2.利用正则表达式把源代码中的图片地址过滤出来
3.根据过滤出来的图片地址下载网络图片
利用python抓取网络图片的步骤:
1.根据给定的网址获取网页源代码
2.利用正则表达式把源代码中的图片地址过滤出来
3.根据过滤出来的图片地址下载网络图片
import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = imgre.findall(html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x = x + 1 html = getHtml("http://tieba.baidu.com/p/2460150866") getImg(html)
相关文章推荐
- Heartbeat+httpd+NFS 实现高可用的Web服务器
- HttpClient状态码大全
- 大神学好网络经验谈
- HTTP服务七层架构技术探讨
- tcpdump工具的使用
- android http协议post请求方式
- SNMP:简单网络管理协议
- (转)Android 判断用户2G/3G/4G移动数据网络
- SNMP详细资料
- 【Android】Volley网络异步通信框架的使用
- 【Android】Volley网络异步通信框架的使用
- 虚拟机上安装Ubuntu Server解决网络配置
- iOS开发网络篇—HTTP协议
- HTTP状态码详解
- HTTP Content-type
- VMware11-CentOS7虚拟机增加桥接模式网络适配器之后不能从物理机中拖动复制文件
- 网络绘制插件
- II7下配置SSAS通过HTTP 远程链接访问
- 堆栈,内存管理,转载自网络
- Linux tcpdump命令详解