PHP採集CSDN博客边栏的阅读排行
2015-04-30 18:05
169 查看
项目中要用到採集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它可以方便的遍历HTML文档。
扩展:
PHP Simple HTML DOM解析器使用入门
<?php include_once('simple_html_dom.php'); header('Content-Type:text/html;charset=utf-8'); $html = file_get_html('http://blog.csdn.net/szy361'); $res = $html->find('#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title $span = $html->find('#hotarticls ul.panel_body li span');//取得span foreach($res as $element){ $arr[] = $element->title.'+'.$element->href;//将title值和href的值通过+连起来 } foreach($span as $e){ $brr[] = $e->innertext;//得到span下的值组成的数组 } //将两个数组组成一个新的二维数组 for($i=0;$i<count($res);$i++){ $crr[] = explode('+',$arr[$i]); $crr[$i][] = $brr[$i]; } return $crr;
扩展:
PHP Simple HTML DOM解析器使用入门
相关文章推荐
- PHP采集CSDN博客边栏的阅读排行
- PHP采集CSDN博客边栏的阅读排行
- PHP采集CSDN博客边栏的阅读排行
- php刷csdn博客访问,爬虫测试
- php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)
- CSDN博客阅读量大于100万/次 大牛排行榜
- 第二个爬虫:查看csdn博客阅读数
- CSDN个人博客阅读评论信息的爬取
- 简单爬虫,爬取CSDN博客阅读数量并存入数据库
- CSDN博客 Android 客户端下载, 阅读博客和资讯,搜索博客,离线阅读
- 火狐扩展:CSDN 博客页面自动 “阅读全文”
- csdn博客在百度搜索中排行很前
- 自动检测CSDN博客文章阅读次数的爬虫
- csdn博客在百度搜索中排行很前
- Chrome插件开发之CSDN博客阅读模式
- 阅读鸟哥的风雪之隅PHP博客的笔记(1)
- 用PHP的XML扩展库读取CSDN博客的RSS列表信息
- 新版CSDN博客的排行是不是出问题了?
- Java网络编程(一) - Java网页爬虫 - 爬取自己的CSDN博客标题和阅读数(附源码)
- CSDN博客 Android 客户端免费下载, 阅读博客和资讯,搜索博客,离线阅读