php获取页面所有链接的正则表达式
2012-08-02 00:38
501 查看
php获取页面所有链接的正则表达式
演示网址:phpParseLinks
修改:上面pattern中新增?,红色标记。修复无http://与域名情况。
$pattern = '/<a(?:.*?)href="(((?:http(?:s?):\/\/)?([^\"\/]+))?(?:[^\"]*))"(?:[^>]*?)>([^<]*?)<\/a>/i'; preg_match_all($pattern, $data, $links); $links[0]是所有<a>标签。 $links[1]是所有href。 $links[2]是所有带http(s)://链接。 $links[3]是所有域名,如:www.cnblogs.com。 $links[4]是所有a标签内容。 直接获取<a>标签:$pattern = '/<a.*?<\/a>/i'; 仅获取href数据:$pattern = '/<a(?:.*?)href=[\'"]([^\"\']*)[\'"][^<]*?<\/a>/i'; //仅href 单双引号,href前换行,href后等号前后夹杂空格,a标签内嵌标签等一堆情况解决方案: $pattern = '/<a(?:[\s\S]*?)href\s*?=\s*?[\'"](((?:http(?:s?):\/\/)?([^\"\'\/]+))?(?:[^\"\']*))[\'"](?:[^>]*?)>([\s\S]*?)<\/a>/i';
演示网址:phpParseLinks
修改:上面pattern中新增?,红色标记。修复无http://与域名情况。
相关文章推荐
- php正则表达式获取内容所有链接
- php正则表达式获取内容所有链接
- Java获取网页所有网址和链接文字(正则表达式)
- PHP代码:获取指定URL页面中的所有链接
- PHP通过正则表达式获取网页中的所有图片
- PHP获取指定URL页面中的所有链接
- php获取远程页面上的所有链接
- php正则表达式取得内容所有链接的方法
- php不用正则表达式获取文章A标签链接的方法
- PHP 获取指定URL页面中的所有链接
- Java正则表达式获取网页所有网址和链接文字
- PHP正则获取页面所有图片地址
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- php正则表达式取得内容所有链接的方法
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- PHP代码:获取指定URL页面中的所有链接
- PHP 获取指定URl页面中所有链接
- node.js正则表达式获取网页中所有链接的代码实例
- PHP正则获取页面所有图片地址
- 用正则表达式得到一个页面的所有链接