20行代码实现网页图片抓取。(待完善
2016-04-16 11:38
513 查看
终于到这题了,话不多说。直接上代码。
#coding:utf-8 #By :晓明酱 #Date:2016/4/16 #参考:http://blog.csdn.net/xiaowanggedege/article/details/8650034 import urllib,re def get_html(url): page = urllib.urlopen(url) html = page.read() return html def get_img(html): reg = r'src="(.*?\.jpg)"' imgre = re.compile(reg) #创建模式对象 imglist = re.findall(imgre, html) #列出所有的匹配项 i = 0 for imgurl in imglist: urllib.urlretrieve(imgurl, r'D://img/%s.jpg'%i) i+=1 html = get_html('http://tieba.baidu.com/p/4483145121') print get_img(html)
相关文章推荐
- Java classpath and directories
- Code Forces Bear and Forgotten Tree 3 639B
- 唯品会在线编程:爱情数字,动态规划
- Java开发中的23种设计模式详解(转)
- Code Forces Bear and Forgotten Tree 3 639B
- Java多线程学习
- Train_TransE代码注释
- java之路径分隔符介绍
- Java线程创建和启动
- java.net.UnknownHostException
- [转载]java正则表达式
- C++英文面试常见问题
- C++ 标准库 —— random
- PHP函数
- 用C++封装一个String
- phpmyadmin
- C#匿名方法和Lambda表达式
- SDM(Supervised Descent Method)用于人脸对齐的C++实现方法
- C++学习笔记之二 C++基础学习2
- java基础---静态变量、静态块、非静态块、构造函数及静态方法总结及一点儿想法