您的位置:首页 > 其它

获取网页所有的url 正则

2010-11-09 18:11 134 查看
$index_page = file_get_contents('http://www.sina.com.cn');
$rule = '@<a.*?href=("|/'|)([^/'"#{};/s]+)("|/'|).*?>@ims';
preg_match_all($rule,$index_page,$out);
$all_index_urls = $out[2];
if(!empty($all_index_urls)){
foreach($all_index_urls as $k =>$url){
if(strpos($url,':void(') !== false){
unset($all_index_urls[$k]);
}
}
}
echo '<pre>';
print_r($all_index_urls);
echo '</pre>';
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: