python爬取抖音APP视频教程
Python爬虫人工智能教程:www.python88.cn
编程资源网:www.python66.cn
本文讲述爬取抖音APP视频数据(本文未完,后面还有很多地方优化总结)
源码获取:
点击下方获取源码在论坛获取:
>> 获取源码 链接:http://www.bat666.cn/forum.php?mod=viewthread&tid=438&extra=
1、APP抓包教程,需要用到fiddler
fiddler配置和使用查看>>王者荣耀盒子APP抓包配置方法
2、寻找返回用户aweme_count和uid数据的接口
进入我关注的抖音用户主页,找到用户的抖音号并记录下来,该抖音号为unique_id(unique_id区别于uid)
用户主页有如下数据:如图所示
注:该页面并没有返回我们需要的uid数据,需要通过如下方式搜索,在另外一个页面抓包才能获取
抖音主页点击搜索图标
输入用户主页获取到的unique_id值,并点击搜索
进入该页面,切换到用户栏,该页面会返回我们需要的数据和接口
fiddler抓包,该接口返回我们需要的两个参数,作品数aweme_count和用户uid
上代码,input输入的为用户主页的unique_id,传入下面的方法中
拿到unique_id,我们请求接口,提取我们需要的数据aweme_count和uid,并打印成功,这一步结束
注:本网站为HTTPS加密,需要加verify=False参数,并要加headers
3、接下来寻找视频播放页面接口
手机切换到用户主页,会出现我们需要抓包的接口,因为用户主页有视频,自然接口在这里面
抓包,成功抓到下面图中所示的share_url接口,该接口需要我们传2个参数,就是上一步我们获取到的aweme_count和uid
注:share_url并不是最终我们真正下载视频的接口,需要对share_url返回的数据进一步提取,才能找到真正的视频接口
上代码,但该接口测试一些发现有些不方便用,经查阅网上一些资料,发现需要用到抖音之前的老接口,如代码中所示
这里获取得到的video_urls是一个假的视频接口,需要进一步提取真的视频接口
将video_urls传进下载视频的方法中,中间我调用了get_download_url方法,进一步提取真正的视频接口
提取真正视频接口,通过get请求假接口,在返回的一大坨响应中通过正则匹配提取
这里简单截图了两个视频接口的区别,这幅图是假的视频接口,虽然也有视频,但并不是真正的
下面这个才是我们真正的视频接口,整个页面只有 3ff7 一个视频,直接下载视频数据
源码获取:
点击下方获取源码在论坛获取:
>> 获取源码 链接:http://www.bat666.cn/forum.php?mod=viewthread&tid=438&extra=
- 资料|python软件安装+10G的免费学习视频教程!!!
- python全栈开发视频教程
- 用Python的Django框架完成视频处理任务的教程
- 【备忘】2017最新python教程老男孩Python14期视频教程下载
- Python 教程视频汇总
- 老男孩Python运维自动化开发14期视频教程 金角大王Aex老师主讲28周 15-28周部分
- Python爬虫入门教程 51-100 Python3爬虫通过m3u8文件下载ts视频-Python爬虫6操作
- python 全套教程视频 传智博客 百度网盘
- 2018最新Python数据分析实战教程视频 python数据分析班视频 Python数据分析基础教程 利用Python进行数据分析
- Python系列视频教程: Django【13讲】第五讲 URL配置
- 【备忘】12套 python视频教程汇总【共33G】
- python爬虫(入门教程、视频教程)[原创]_python_脚本之家
- 在Python的web框架中配置app的教程
- 最近找到了一个免费的python教程,两周学会了python开发【内附学习视频】
- 2017年老男孩最新全栈python第2期视频教程(92天全)
- Python3爬虫视频学习教程
- 最近找到了一个免费的python教程,两周学会了python开发【内附学习视频】
- Python 视频教程百度云分享
- 最新黑马Python入门视频教程
- 爬虫进阶教程:抖音APP无水印视频批量下载