获取网页所有的url 正则
2010-11-09 18:11
134 查看
$index_page = file_get_contents('http://www.sina.com.cn'); $rule = '@<a.*?href=("|/'|)([^/'"#{};/s]+)("|/'|).*?>@ims'; preg_match_all($rule,$index_page,$out); $all_index_urls = $out[2]; if(!empty($all_index_urls)){ foreach($all_index_urls as $k =>$url){ if(strpos($url,':void(') !== false){ unset($all_index_urls[$k]); } } } echo '<pre>'; print_r($all_index_urls); echo '</pre>';
相关文章推荐
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- PHP通过正则表达式获取网页中的所有图片
- 正则表达式获取网页中所有图片的路径
- node.js正则表达式获取网页中所有链接的代码实例
- Java获取网页所有网址和链接文字(正则表达式)
- C#获取远程网页中的所有链接URL(网络蜘蛛实现原理)
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- [转]正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- 获取网站所有的url正则表达式
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- 正则表达式获取url中的所有参数和值
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- php通过正则从字符串中获取所有图片url地址
- PHP通过正则表达式获取网页中的所有图片
- C#基于正则表达式实现获取网页中所有信息的网页抓取类实例
- Java中使用正则表达式获取网页中所有图片的路径
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- Java中使用正则表达式获取网页中所有图片的路径