您的位置:首页 > 其它

正则表达式 提取<A>标签

2013-12-29 17:51 211 查看

功能用途

主要实现了提取html代码中的a标签和url地址。

示例代码

Regex regex = new Regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))", RegexOptions.IgnoreCase);
Regex regex1 = new Regex(@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>", RegexOptions.IgnoreCase);

for (Match m = regex1.Match(pageindex); m.Success; m = m.NextMatch())
{
string tempurl = m.Groups[1].Value.ToString();
string title = m.Groups[2].Value.ToString();
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: