您的位置:首页 > 编程语言 > Python开发

Python 刷今日头条阅读量

2018-03-06 23:39 1676 查看

因为一直在爬今日头条的数据

在下午的时候,爬着爬着就不小心萌发出了刷今日头条文章阅读量的想法,该文章只适合技术交流,并不做商业用途

也许爬过今日头条的战友们都知道,今日头条的_signature 一直不知道怎么获取,当然,我也是苦恼了一阵,但是后面还是把这个_signature这个值是从哪里取得的知晓了,但是,这个值的获取的文件用了7000行代码,算法那一块也是无从下手。emmm…… 扯远了,回归正题吧。

该教程只适合新手,大牛就不用继续往下看了

方法原理很简单,直接用了selenium+webdriver 这两个库

下面贴上代码:

import time

import requests
from selenium import webdriver

def refresh_html(jianshu_url):
chromedriver = "C:\Program Files (x86)\Google\chromedriver_win32\chromedriver.exe"
browser = webdriver.Chrome(chromedriver)
browser.get(jianshu_url)
while True:
time.sleep(1)
browser.refresh()

if __name__ == '__main__':
url = 'https://www.toutiao.com/i6482646112527188494/'
try:
refresh_html(url)
except:
refresh_html(url)


刷之前:



刷之后:



注意一点

今日头条访问次数多的情况下对IP进行验证码验证的情况。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: