(网页抓取)一个用PHP实现的网页抓取的实例
2013-04-13 14:51
721 查看
PHP实现的网页抓取的实例
<? $url = "http://www.lingjuli99.com/new.asp"; $contents = file_get_contents($url); echo $contents; $url = "http://www.lingjuli99.com/new.asp"; $ch = curl_init(); $timeout = 5; curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); //在需要用户检测的网页里需要增加下面两行 //curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY); //curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD); $contents = curl_exec($ch); curl_close($ch); echo $contents; $handle = fopen ("http://www.xxx.com/", "rb"); $contents = ""; do { $data = fread($handle, 8192); if (strlen($data) == 0) { break; } $contents .= $data; } while(true); fclose ($handle); echo $contents; if(function_exists('fsockopen')) { $urlinfo = parse_url($url); $host = $urlinfo['host']; $str = explode($host, $url); $uri = $str[1]; unset($urlinfo, $str); $content = ''; $fp = fsockopen($host, 80, $errno, $errstr, 30); if(!$fp) { $content = 'Can Not Open Socket...'; } else { $out = "GET $uri HTTP/1.1rn"; $out.= "Host: $host rn"; $out.= "Accept: */*rn"; $out.= "User-Agent: $_SERVER[HTTP_USER_AGENT]rn"; $out.= "Connection: Closernrn"; fputs($fp, $out); while (!feof($fp)) { $content .= fgets($fp, 4069); } fclose($fp); } } $html = file_get_contents($url); print_r($http_response_header); $fp = fopen($url, 'r'); print_r(stream_get_meta_data($fp)); fclose($fp); $zd = gzopen($filename, "r"); $contents = gzread($zd, filesize ($filename)); gzclose($zd); file_put_contents($filename,$contents); ?>
相关文章推荐
- 一个用php抓取网页中电子邮箱的实例
- php中实现的一个curl批处理的实例
- php 实现一个字符串加密解密的函数实例代码
- php实现抓取网站百度快照和百度收录数量的代码实例
- PHP利用Curl实现多线程抓取网页和下载文件
- PHP 抓取网页图片并且另存为的实现代码
- Python实现多线程抓取网页功能实例详解
- PHP实现简单爬虫-抓取网页url
- php使用curl 实现GET和POST请求(抓取网页,上传文件),支持跨项目和跨服务器
- PHP实现多线程抓取网页
- 用PHP实现一个注册网页
- php实现的一个简单json rpc框架实例
- 分享PHP源码批量抓取远程网页图片并保存到本地的实现方法
- PHP获取网页标题的3种实现方法代码实例
- PHP实现AOP的雏形(通过一个简单的实例来理解PHP的AOP)
- PHP实现一个简单url路由功能实例
- PHP实现多线程抓取网页
- php抓取网页的若干实现方式
- PHP采用curl多线程抓取网页功能实现
- PHP 抓取网页图片并且另存为的实现代码