python爬虫实战-爬取视频网站下载视频至本地(selenium)
2019-02-25 15:45
696 查看
#python爬虫实战-爬取视频网站下载视频至本地(selenium)
import requests from lxml import etree import json from selenium import webdriver from selenium.webdriver.chrome.options import Options import time headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36', } max_behot_time=0 video_list=[] def get_json(): global max_behot_time url='http://www.365yg.com/api/pc/feed/?min_behot_time='+str(max_behot_time) r=requests.get(url,headers=headers) obj=json.loads(r.text) max_behot_time=obj['next']['max_behot_time'] data=obj['data'] for video_data in data: title=video_data['title'] a_href='http://www.365yg.com'+video_data['source_url'] down_video(title,a_href) def down_video(title,href): #通过selenium来解析视频网址, path=r'E:\Student\python\day05\driver\chromedriver.exe' chrome_options=Options() chrome_options.add_argument('--Headless') chrome_options.add_argument('--disable-gpu') chrome_options.add_argument('user-agent="Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36"') browser=webdriver.Chrome(executable_path=path,chrome_options=chrome_options) browser.get(href) time.sleep(5) browser.save_screenshot(r'PjPhoto\baidu.png') #获取源码,生成对象,查找video 里面的src tree=etree.HTML(browser.page_source) video_url=tree.xpath('//video[@mediatype="video"]/@src')[0] video_url='http:'+video_url filepath='video/'+title+'.mp4' print('正在下载视频 %s'%title) r=requests.get(video_url) with open(filepath,'wb') as fp: fp.write(r.content) print('%s已下载'%title) browser.quit() def main(): # page=int(input('请输入你要下载的页数(每页7个):')) page=1 for x in range(0,page): get_json() if __name__ == '__main__': main()
相关文章推荐
- python爬虫实战笔记---selenium爬取QQ空间说说并存至本地(上)
- python3 简单爬虫实战|使用selenium来模拟浏览器抓取选股宝网站信息里面的股票
- Java爬虫实战(二):抓取一个视频网站上2015年所有电影的下载链接
- 【备忘】2017年最新Python网络爬虫实战案例视频教程下载 共5章 34课
- python3网络爬虫分享: 借助vip解析破解主流视频网站(最新版:下载及观看)
- Python3网络爬虫应用:爱奇艺等主流视频网站的VIP视频破解(在线观看+视频下载)
- python 网站爬虫 下载在线盗墓笔记小说到本地的脚本
- Python爬虫下载网站上的图片到本地
- python 网站爬虫 下载在线盗墓笔记小说到本地的脚本
- python爬虫实战:利用scrapy,短短50行代码下载整站短视频
- 四周实现Python爬虫实战网站视频教程
- Java爬虫实战(二):抓取一个视频网站上2015年所有电影的下载链接
- python爬虫实战笔记---selenium爬取QQ空间说说并存至本地
- Python爬虫实战(八):爬取电影天堂的电影下载链接
- [Python爬虫] 之二十一:Selenium +phantomjs 利用 pyquery抓取36氪网站数据
- Python爬虫小实践:下载妹子图www.mzitu.com网站上所有的妹子图片,并按相册名字建立文件夹分好文件名
- Python 利用scrapy爬虫通过短短50行代码下载整站短视频
- Python简单知乎爬虫--爬取页面的图片并下载到本地
- 使用Python编写简单网络爬虫抓取视频下载资源
- 直播网站LiveTV Mining,爬虫抓取数据 python3+selenium+phantomjs