.net(C#)从html中提取中文字_正则表达式
2014-12-17 12:51
393 查看
using System.Text.RegularExpressions;
private string StripHT(string strHtml) //从html中提取纯文本
{
Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);
string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容
strOutput = strOutput.Replace("<", "");
strOutput = strOutput.Replace(">", "");
strOutput = strOutput.Replace(" ", "");
return strOutput;
}
private string StripHT(string strHtml) //从html中提取纯文本
{
Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);
string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容
strOutput = strOutput.Replace("<", "");
strOutput = strOutput.Replace(">", "");
strOutput = strOutput.Replace(" ", "");
return strOutput;
}
相关文章推荐
- .net(C#)从html中提取中文字_正则表达式
- C# .Net使用正则表达式去除HTML标记和空格
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- C#正则表达式通过HTML提取网页中的图片src
- C#正则表达式提取HTML中IMG标签的URL地址 .
- C#正则表达式提取HTML中IMG标签的URL地址
- C#正则表达式提取HTML中IMG标签的URL地址
- asp.net(c#)常用正则表达式实例(http://www.cnblogs.com/Aspnet2007/articles/1230060.html)
- C#正则表达式提取HTML中IMG标签的SRC地址
- C#正则表达式提取HTML中IMG标签的SRC地址
- C#正则表达式提取HTML中IMG标签的SRC地址
- 正则表达式笔记:提取C#代码中的中文信息,双引号,尖括号间的信息
- C#正则表达式提取HTML中IMG标签的SRC地址
- C#正则表达式提取HTML中IMG标签中的SRC地址
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- (转)c# .net 使用正则表达式匹配嵌套Html标签
- asp.net正则表达式提取网页网址、标题、图片,滤所有HTML标签
- asp.net正则表达式提取网页网址、标题、图片,滤所有HTML标签
- ASP.NET正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- 【正则表达式】C#正则表达式提取HTML中IMG标签的URL地址