PHP爬虫之刷博客访问量
2017-08-16 11:11
253 查看
本着学以致用的态度,现在想试试用爬虫技术来刷一刷博客访问量。
学习交流之用,不要瞎搞。
学习交流之用,不要瞎搞。
<?php //只需把beginUrl改为你的博客列表首页就可以了 $beginUrl = "http://blog.csdn.net/qq_27988539?viewmode=contents"; $listpage = file_get_contents($beginUrl); //博客列表可能有多页 //获得每一页的链接 $pattern ="/<div id=\"papelist\".*>.*<\/div>/sU"; $arr = array(); if(preg_match_all($pattern,$listpage,$arr)) { $str = $arr[0][0]; $pattern = "/<a.*>.*<\/a>/sU"; $temp1 = array(); if(preg_match_all($pattern,$str,$temp1)) { $temp1 = $temp1[0]; array_splice($temp1,-2); $pages = array(); foreach ($temp1 as $key => $value) { $temp2 = array(); $pattern = "/\".*\"/U"; if(preg_match_all($pattern,$value,$temp2)) { $pages[] = $temp2[0][0]; } } } } $rooturl = "http://blog.csdn.net"; $blogPage = array($beginUrl); if(!empty($pages)) { foreach($pages as $key => $value) { $pages[$key] = preg_replace("/\"/",'', $value); $blogPage[] = $rooturl.$pages[$key]; } } //print_r($blogPage); //获得所有博客的链接 $blogUrls = array(); foreach($blogPage as $key => $value) { $page = file_get_contents($value); $pattern = "/<span class=\"link_title\">.*<\/span>/sU"; if(preg_match_all($pattern,$page,$arr)) { $arr = $arr[0]; foreach($arr as $key => $value) { $pattern = "/<a.*<\/a>/sU"; $temp3 = array(); if(preg_match_all($pattern,$value,$temp3)) { $pattern = "/\".*\"/U"; $str = $temp3[0][0]; $temp4 = array(); if(preg_match_all($pattern,$str,$temp4)) { $blogUrls[] = preg_replace("/\"/","",$temp4[0][0]); } } } } } //var_dump($blogUrls); //遍历访问所有的博客链接 for($i=0;$i<100;$i++) { foreach($blogUrls as $value) { $blogUrl = $rooturl.$value; file_get_contents($blogUrl); sleep(2); } } ?>
相关文章推荐
- python爬虫实战:刷某博客站点的访问量(转)
- 【Python脚本】-爬虫得到CSDN博客的文章访问量和评论量
- Python爬虫小实践:爬取任意CSDN博客所有文章的文字内容(或可改写为保存其他的元素),间接增加博客访问量
- 自动刷CSDN个人博客访问量爬虫
- 爬虫 博客 增加访问量 Jsoup Java 正则 实现
- python爬虫之csdn刷博客访问量
- 使用爬虫刷csdn博客访问量
- Python爬虫爬取博客访问量
- python爬虫设计刷博客访问量(刷访问量,赞,爬取图片)
- Python爬虫小实践:爬取任意CSDN博客所有文章的文字内容(或可改写为保存其他的元素),间接增加博客访问量
- Python爬虫小实践:爬取任意CSDN博客所有文章的文字内容(或可改写为保存其他的元素),间接增加博客访问量
- http编程系列(二)——java爬虫实现刷个人博客的访问量
- 简单CSDN爬虫,实现博客访问量记录
- 用python写网络爬虫-提取我的博客内容
- CentOS下搭建PHP环境与WordPress博客程序的全流程总结
- 关于搭建“Nginx + PHP(FastCGI)”Web服务器的第4篇文章--来自张宴博客
- 认识php钩子-转白俊遥的博客
- PHP爬虫之百万级别知乎用户数据爬取与分析
- jquery博客分享一些php常用代码(二)
- PHP爬虫之百万级别知乎用户数据爬取与分析