C# 去掉HTML标记的正则表达式
2011-04-22 09:23
387 查看
很简单,可是却学了很久才理解.
string reg = @"[<].*?[>]";
source = Regex.Replace(source, reg, "");
理解为:@表示后面的字符串表示实际意义,[<] 表示以小于号开头, [<].* 表示以小于号开头,后面匹配任意字符, ? 问号表示懒惰匹配,即重复任意次,但尽可能少重复,后面[>]表示到匹配到大于号结束. 写给自己备忘,也给像我这样的菜鸟参考.
string reg = @"[<].*?[>]";
source = Regex.Replace(source, reg, "");
理解为:@表示后面的字符串表示实际意义,[<] 表示以小于号开头, [<].* 表示以小于号开头,后面匹配任意字符, ? 问号表示懒惰匹配,即重复任意次,但尽可能少重复,后面[>]表示到匹配到大于号结束. 写给自己备忘,也给像我这样的菜鸟参考.
相关文章推荐
- C# .Net使用正则表达式去除HTML标记和空格
- 正则表达式,js去掉html标记,去掉字符,截取字符
- 正则表达式,js去掉html标记,去掉字符,截取字符
- 中正则表达式,js去掉html标记,去掉字符,截取字符
- C#、JS利用正则表达式清理HTML标记一例
- 去掉字符串不需要的HTML标记(正则表达式)
- C#用正则表达式去掉Html中的script脚本和html标签
- 正则表达式获取HTML标记中的内容(C#)
- 正则表达式获取HTML标记中的内容(C#)
- C#去掉html标签正则表达式
- C#正则表达式整理备忘 转载(http://www.cnblogs.com/KissKnife/archive/2008/03/23/1118423.html)
- 使用C#将HTML文本转换为普通文本,去掉所有的Html标记
- 利用正则表达式去掉网页中的HTML 标签
- C#正则表达式匹配HTML中的图片路径
- C#中可以使用正则表达式来过滤html字符
- 去掉html中<script>标签的正则表达式
- c#正则过滤html标记
- C# 使用正则表达式去掉字符串中的数字
- 正则表达式相关:C# RichTextBox显示html文本内容
- C#正则表达式匹配HTML中的图片路径,图片地址