php 抓取网页信息
2016-09-12 20:56
225 查看
最近要抓取网页数据,就用php试了下,发现了一个不错的php抓取数据的集成类simple_html_dom.php,
而根据网页的特点大致分为两类,一类是网页dom结构相同,url类似只是改了部分参数,这个
直接用$html =file_get_html($url); 然后根据网页dom用$html->find()->plaintext来获取数据,
第二类是网页dom结构相同,只是url不能直接访问到,这就需要在其前一个页面找到该页面的url和要传入的数据,
然后用curl 模拟提交,$str=$this->https_post($url,$data); $html =str_get_html($str);之后处理的方法是一样的,
当然这种方法只能抓取少量的数据,三四千个页面还算处理的过来,一旦数据上万,就不行了,太费时间了,
不知道php是否有更好方法去抓取数据。
而根据网页的特点大致分为两类,一类是网页dom结构相同,url类似只是改了部分参数,这个
直接用$html =file_get_html($url); 然后根据网页dom用$html->find()->plaintext来获取数据,
第二类是网页dom结构相同,只是url不能直接访问到,这就需要在其前一个页面找到该页面的url和要传入的数据,
然后用curl 模拟提交,$str=$this->https_post($url,$data); $html =str_get_html($str);之后处理的方法是一样的,
当然这种方法只能抓取少量的数据,三四千个页面还算处理的过来,一旦数据上万,就不行了,太费时间了,
不知道php是否有更好方法去抓取数据。
相关文章推荐
- php抓取网页信息
- php抓取alexa网页内容 提取站点统计信息
- php 实现信息采集(网页内容抓取)程序代码
- (PHP)用cURL抓取网页信息并替换部分内容
- 抓取网页信息PHP
- 网页抓取信息(php正则表达式、php操作excel)
- 网页抓取信息(php正則表達式、php操作excel)
- 实用PHP网页抓取
- C#实现通过程序自动抓取远程Web网页信息(转载)
- 实用PHP网页抓取
- 针对某个网页的快照以及某些重要信息的抓取代码解析_2
- 网页信息抓取实现
- PHP抓取网页内容汇总3
- PHP 抓取网页源文件
- PHP抓取网页和分析
- PHP抓取基本信息
- PHP抓取网页内容汇总2
- C#实现通过程序自动抓取远程Web网页信息
- PHP抓取网页内容汇总
- [转载] C#实现通过程序自动抓取远程Web网页信息