PHP爬虫之解析页面的方法
2017-08-17 10:02
155 查看
爬取页面一般比较容易,麻烦的是如何解析。PHP解析页面大概有两种方式:
(1)PHP DOMDocument对象。
(2)正则表达式,个人觉得这种方式比较麻烦。
DOMDocument对象还是很好用的,它提供的方法名跟js中的dom常用的几个方法都是一样的,学习成本不高。
个人在实践中发现,把正则表达式与DOMDocument对象结合起来使用,是最好的。单独使用,往往会比较麻烦。
官方文档:https://secure.php.net/manual/zh/class.domelement.php
只用看DOMElement class 和 DOMNodeList class 就可以解决所有解析问题了。
(1)PHP DOMDocument对象。
(2)正则表达式,个人觉得这种方式比较麻烦。
DOMDocument对象还是很好用的,它提供的方法名跟js中的dom常用的几个方法都是一样的,学习成本不高。
个人在实践中发现,把正则表达式与DOMDocument对象结合起来使用,是最好的。单独使用,往往会比较麻烦。
官方文档:https://secure.php.net/manual/zh/class.domelement.php
只用看DOMElement class 和 DOMNodeList class 就可以解决所有解析问题了。
相关文章推荐
- PHP网站页面静态化方法解析
- PHP中的XML解析的5种方法
- 介绍生成PHP网站页面静态化的方法
- nginx+php-fpm配置后页面显示空白的解决方法
- php解析url三个方法与实例
- php实现refresh刷新页面批量导入数据的方法
- php在页面中调用fckeditor编辑器的方法
- Nginx无法正确解析PHP文件,配置文件方法
- PHP+Curl伪造客户端获取页面方法
- PHP页面跳转几种实现方法
- PHP XML解析之DOMDocument 方法实例讲解
- PHP中实现页面刷新或跳转的方法
- 让PHP支持页面回退的两种方法[转]
- 三种实现PHP伪静态页面的方法(转)
- 解析PHP实现下载文件的两种方法
- php重定向页面方法
- js用ajax和jison在不同页面的php和html之间互相传值的方法
- PHP页面无法输出XML的解决方法
- php使用parse_str实现查询字符串解析到变量中的方法
- 解析crontab php自动运行的方法