正则表达式 提取<A>标签
2013-12-29 17:51
211 查看
功能用途
主要实现了提取html代码中的a标签和url地址。示例代码
Regex regex = new Regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))", RegexOptions.IgnoreCase); Regex regex1 = new Regex(@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>", RegexOptions.IgnoreCase); for (Match m = regex1.Match(pageindex); m.Success; m = m.NextMatch()) { string tempurl = m.Groups[1].Value.ToString(); string title = m.Groups[2].Value.ToString(); }
相关文章推荐
- 正则表达式 替换 <img > 标签
- 正则表达式获取字符串中html<input>标签指定value值
- 正则表达式过滤 成对标签(<key>a</key> 过滤html标签)
- PHP正则表达式提取字符串中尖括号<>、小括号()、中括号[]、大括号{}中的字符串
- 正则表达式 清除<>标签样式
- C# 正则表达式去除<p>标签
- JS正则表达式匹配<div><style>标签
- 去掉html中<script>标签的正则表达式
- HTML <a> 标签的正则表达式
- 使用java正则表达式过滤HTML ,获取<body>标签中的内容解决思路
- img 的正则表达式:匹配<img>标签
- 正则表达式,清除HTML标签,但要保留 <br>和<img>标签,其他的清除
- HTML中<script ...>....</script>标签的正则表达式?
- HTML <a> 标签的正则表达式
- 【正则表达式】C#正则表达式提取HTML中IMG标签的URL地址
- 正则表达式:过滤<font>和</font>
- 正则表达式分析/提取XML/XHTML标签属性
- python <3> 正则表达式
- 正则表达式 <A HREF>
- struts2标签<s:if>和部分表达式的使用