提取网页中链接和标题的正则表达式
2005-08-19 08:57
344 查看
StreamReader sr = new StreamReader("c://sina.htm",System.Text.Encoding.Default);
string strHtml = sr.ReadToEnd();string p *)""|'(?<url>[^']*)'|(?<url>[^/>^/s]+)).*/>(?<title>[^/<^/>]*)/</.*/</a/]=@"/<a.*href/s*=/s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^/>^/s]+)).*/>(?<title>[^/<^/>]*)/</.*/</a/>";Regex reg = new Regex(p, RegexOptions.IgnoreCase | RegexOptions.Compiled);
MatchCollection ms = reg.Matches(strHtml);
foreach(Match m in ms)
{
Console.WriteLine("{0}/n{1}/n/n", m.Groups["title"].Value, m.Groups["url"].Value);
}
string strHtml = sr.ReadToEnd();string p *)""|'(?<url>[^']*)'|(?<url>[^/>^/s]+)).*/>(?<title>[^/<^/>]*)/</.*/</a/]=@"/<a.*href/s*=/s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^/>^/s]+)).*/>(?<title>[^/<^/>]*)/</.*/</a/>";Regex reg = new Regex(p, RegexOptions.IgnoreCase | RegexOptions.Compiled);
MatchCollection ms = reg.Matches(strHtml);
foreach(Match m in ms)
{
Console.WriteLine("{0}/n{1}/n/n", m.Groups["title"].Value, m.Groups["url"].Value);
}
相关文章推荐
- 提取网页中链接和标题的正则表达式
- 基础算法7:使用正则提取网页中a标签的链接和标题
- ASP.NET正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- 用正则表达式提取网页中的链接
- asp.net正则表达式提取网页网址、标题、图片,滤所有HTML标签
- PHP正则表达式提取网页的超链接及标题
- 软件开发,创意是灵魂——用HttpWebRequest和正则表达式提取网页中的链接
- java 使用正则表达式从网页上提取网站标题
- Java正则表达式提取网页url和链接文字【2008年4月19日最新修改】
- 用HttpWebRequest和正则表达式提取网页中的链接
- php 正则表达式提取网页超级链接url的函数
- 10.用正则表达式 提取网页中的网站链接
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- java学习-- 使用正则表达式从网页上提取网站标题
- java 使用正则表达式从网页上提取网站标题
- asp.net正则表达式提取网页网址、标题、图片,滤所有HTML标签
- node.js正则表达式获取网页中所有链接的代码实例