PHP采集CSDN博客边栏的阅读排行
2016-01-19 00:00
691 查看
项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。
扩展:
PHP Simple HTML DOM解析器使用入门
<?php include_once('simple_html_dom.php'); header('Content-Type:text/html;charset=utf-8'); $html = file_get_html('http://blog.csdn.net/szy361'); $res = $html->find('#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title $span = $html->find('#hotarticls ul.panel_body li span');//取得span foreach($res as $element){ $arr[] = $element->title.'+'.$element->href;//将title值和href的值通过+连起来 } foreach($span as $e){ $brr[] = $e->innertext;//得到span下的值组成的数组 } //将两个数组组成一个新的二维数组 for($i=0;$i<count($res);$i++){ $crr[] = explode('+',$arr[$i]); $crr[$i][] = $brr[$i]; } return $crr;
扩展:
PHP Simple HTML DOM解析器使用入门
相关文章推荐
- Yii2 菜单menu管理
- PHP分页
- 很多学ThinkPHP的新手会遇到的问题
- Yii2:推荐一个方法arrayHelper::map()
- ThinkPHP框架学习之使用数组进行查询
- Yii2-admin RBAC权限管理的实现
- ThinkPHP 多表查询-如果字段A相同,则把字段B相加
- php连接数据库输出的中文几个字就…
- ThinkPHP框架学习之CRUD
- PHP使用flock实现文件加锁的方法
- PHP错误:Allowed memory size of xxx bytes(一)
- PHP错误:Allowed memory size of xxx bytes(二)
- laravel
- php命名空间与自动加载函数一起使用
- 最新版本 IntelliJ IDEA 15. PyCharm 5. PhpStorm10. WebStorm 11 注册 破解
- 用matplotlib作图步骤
- php文件下载
- SmtpClient 类
- ubuntu下配置NFS,TFTP服务
- PHP 依赖注入 (转)