您的位置:首页 > 编程语言 > Python开发

Python爬取哔哩哔哩实时直播弹幕

2017-11-14 00:00 141 查看
專 欄




作者:麦艳涛,挖掘机小王子,数据分析爱好者。



用Python爬取哔哩哔哩直播弹幕,关键在于找到哔哩哔哩网站的一个POST网址,和应该POST的数据。代码不长,十分简单。关键在于浏览器开发者工具的使用。希望对于新入门的萌新有一定的借鉴意义。
1、找到POST的网址
先找到一个直播间,点击进去【感觉是废话】。
打开开发者工具【F12】,差不多是这样。



然后刷新【F5】,并点击方法翻到最上面,或者最下面,在这里可能会弹出两三个POST数据【如下图所示】,不要管有几个POST格式的文件,找到下图中标记的哪一个!!



这个文件就包含了我们需要的弹幕。但是,我们需要向服务器提交一下数据,服务器才会返还给我们数据,也就是弹幕。所以在上图的基础上点击右下角的参数。点击后如下图:



在这里会出现三个我们需要提交的数据【注意,我在写这篇文章之前是只需要提交两个数据的】,不过没关系提交三个应该也可以。但是下面的代码里面写的是两个参数,你可以照着我的参数格式直接再加一个就行。最后就是用requests提交参数就行,返回的网页用json方法解析一下就可以很方便的提取了,不用写正则。代码比较少,而且也有注释,所以就不在这里啰嗦了。
2、Python代码




长按扫描关注Python中文社区,
获取更多技术干货!
    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: