CSDN刷阅读数
2019-10-26 21:59
246 查看
今天我们来盘一下csdn,做一个小程序,为什么做这个呢?今天小编看着我的博客的阅读数,唉,惨不忍睹,没办法,只能想一些........呃呃呃呃,你懂的。
话不多说,分析一波csdn的阅读数,计数原理是每次进入页面记作一次,所以我们很简单的构建一个访问的小爬虫就好了,那么开始操作。
import requests import time from lxml import etree import random def post_article(): '''下面url换成自己的,获取自己所有博客的链接''' response = requests.get(url='me_url',headers = getHeaders()) text = response.content.decode('utf-8') html = etree.HTML(text) urls = html.xpath('//h4/a/@href') for url in urls: article_url.append(url) def access_url(): '''访问其中一个url,随机从自己的博客中选中进行访问''' try: url = random.choice(article_url) response = requests.get(url, headers=getHeaders()) time.sleep(2) except Exception as e : print(e)
根据上面的代码,你的博客阅读数会蹭蹭的上涨,唉,想想都泪奔,要靠这种,
我们下面写一下注意的就可以,设置headers,还有睡眠时间等,频繁的访问会使服务器拒绝为你增加阅读数,you ok?(散装英语).
再加上我们设置的headers:
def getHeaders(): user_agent_list = [ \ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1" \ "Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11", \ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6", \ "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6", \ "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1", \ "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5", \ "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5", \ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3", \ "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3", \ "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3", \ "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3", \ "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24", \ "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24" ] UserAgent = random.choice(user_agent_list) headers = {'User-Agent': UserAgent} return headers
主程序代码块:
if __name__ == '__main__': index = 0 post_article() print('进行到这了。。。') while True: access_url() print(index) index += 1 '''自己随意设计的次数''' if index == 100000: break
这个小爬虫就这么出来了,不要过度使用,只为学习技术,有任何纠纷跟我无关(瑟瑟发抖)。
相关文章推荐
- csdn阅读更多需要注册登录csdn
- PHP採集CSDN博客边栏的阅读排行
- 通过爬虫代理IP快速增加博客阅读量——亲测CSDN有效!
- (csdn)阅读数小程序v1.0
- Java网络编程(一) - Java网页爬虫 - 爬取自己的CSDN博客标题和阅读数(附源码)
- 网络爬虫---爬取CSDN个人博客,增加博客阅读量实战(内含用户代理池知识)
- 爬虫实现csdn文章一键(批量)更换阅读类型(全部可见、粉丝可见、vip可见)
- Chrome插件开发之CSDN博客阅读模式
- 为何引入核函数的理解(在理解SVM原理的前提下阅读)推荐看:http://blog.csdn.net/v_july_v/article/details/7624837
- 阅读目前CSDN帖子静态XML文件报错误的解决方法
- 阅读目前CSDN帖子静态XML文件报错误的解决方法
- tampermonkey 如何引用Jquery+CSDN阅读模式案例
- CSDN博客 Android 客户端下载, 阅读博客和资讯,搜索博客,离线阅读
- python 代码刷取CSDN阅读量
- CSDN《技术经理世界》电子杂志试刊——免费下载阅读
- CSDN博客 Android 客户端下载, 阅读博客和资讯,搜索博客,离线阅读
- PHP采集CSDN博客边栏的阅读排行
- 为什么现在CSDN首页没有什么内容能吸引我点击仔细阅读呢?
- 成功抓取csdn阅读量过万博文
- 第二个爬虫:查看csdn博客阅读数