您的位置:首页 > 编程语言 > PHP开发

PHP 抓取网页源文件

2009-12-07 01:06 141 查看
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>抓取远程网页HTML源文件</title>
</head>
<body>
<?php
$url="www.youku.com"; //获取目标
$getstr="/";
$fp=@fsockopen($url,80,$errno,$errstr,10);
if (!$fp){
echo "$errstr ($errno)<br>"; //如果打开失败,则把错误信息输出.
}
else {
fputs($fp,"GET ".$getstr." HTTP/1.1/r/nHost:www.phperz.com/r/nConnection: Close/r/n/r/n"); //正确打开,发送请求头信息
//关于http头信息你可以参考本站的另一篇文件 HTTP协议头信息详解

while (!feof($fp)){
$data.= fgets($fp,1024); //fgets为 逐行读取,后面的1024为一行最多返回多少字节的数据,可以不指定默认为1K,也就是1024字节.
}
fclose($fp);
}
echo "<textarea name='ttt3' id='ttt3' cols='60' onclick='tt()' rows='30' value='".$data."'></textarea>";

?>
</body>
</html>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: