016讲五行爬虫网站图片,视频代码
2017-08-23 15:09
211 查看
一图片代码
import urllib.request
import re
for page in range(254,256):
req = urllib.request.Request("http://jandan.net/ooxx/page-%s#comments"%page) #请求
req.add_header("user-agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36
Core/1.53.3226.400 QQBrowser/9.6.11681.400")
for i in re.findall(r'img src="(.*?)"',urllib.request.urlopen(req).read().decode('utf-8')): #匹配
j = "http:"+ i
file_name =i.split("/")[-1]
urllib.request.urlretrieve(j,'正则下载/%s'%file_name)
#下载的方法
2.视频代码详解
import urllib.request
import re
def getvideo(page):
req = urllib.request.Request("http://www.budejie.com/video/%s"%page)
#请求
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3226.400 QQBrowser/9.6.11681.400")
html = urllib.request.urlopen(req).read().decode('utf-8')
#响应与解码
reg = r'data-mp4="(.*?)"'
for i in re.findall(reg,html):
#匹配
#print('正在下载:%s'% i)
file_name =i.split("/")[-1]
urllib.request.urlretrieve(i,'爬虫视频/%s'%file_name)
#下载的方法
for i in range(1,11):
getvideo(i)
import urllib.request
import re
for page in range(254,256):
req = urllib.request.Request("http://jandan.net/ooxx/page-%s#comments"%page) #请求
req.add_header("user-agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36
Core/1.53.3226.400 QQBrowser/9.6.11681.400")
for i in re.findall(r'img src="(.*?)"',urllib.request.urlopen(req).read().decode('utf-8')): #匹配
j = "http:"+ i
file_name =i.split("/")[-1]
urllib.request.urlretrieve(j,'正则下载/%s'%file_name)
#下载的方法
2.视频代码详解
import urllib.request
import re
def getvideo(page):
req = urllib.request.Request("http://www.budejie.com/video/%s"%page)
#请求
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.3226.400 QQBrowser/9.6.11681.400")
html = urllib.request.urlopen(req).read().decode('utf-8')
#响应与解码
reg = r'data-mp4="(.*?)"'
for i in re.findall(reg,html):
#匹配
#print('正在下载:%s'% i)
file_name =i.split("/")[-1]
urllib.request.urlretrieve(i,'爬虫视频/%s'%file_name)
#下载的方法
for i in range(1,11):
getvideo(i)
相关文章推荐
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(3)
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(3)补充知识点:htmlcleaner使用案例
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)补充正则:java Pattern和Matcher详解
- java实现爬虫爬网站图片的实例代码
- 运维学python之爬虫高级篇(四)Item Pipeline介绍(附爬取网站获取图片到本地代码) 推荐
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(1)
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(3)补充知识点:怎样获取XPath
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)
- Java简单实现爬虫技术,抓取整个整个网站所有链接+图片+文件(思路+代码)
- python实现爬取网站图片,视频动画到指定路径(附代码)
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(4)补充: Java正则表达式Matcher.group(int group)相关类解析
- 十五行代码爬取百思不得姐网站数百视频
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(3)补充知识点:XPath无效怎么办?
- python爬虫爬网站的视频和图片
- 【python】100行代码python爬虫程序,抓取网站图片存储本地(附:中文链接解决)
- 十五行代码爬取百思不得姐网站数百视频
- 十五行代码爬取百思不得姐网站数百视频
- 优酷电视剧爬虫代码实现一:下载解析视频网站页面(2)
- 情趣编程学习网站:边写代码边看视频美女教员边脱衣服
- 部分网站允许空白referer的防盗链图片的js破解代码