您的位置:首页 > Web前端 > HTML

如何使用正则表达式删除html语言中的html标记

2013-09-20 14:39 288 查看
System.Text.RegularExpressions.Regex.Replace(TempContent,"<\/?[^>]+>","")搜索

贪婪匹配,

因为所有的HTML标签都是由<>组成的,所以我的方法是找所有具有"<"和">"的组合,

<\/?[^>]+>的思想是先找到"<",然后再匹配是否有"/"符号,并且用\

做转义,而?的作用是匹配前面的字符0次或一次,也就是说有“/”这个符号或者是没有这个符号都算匹配成功,继续,[^>] 的意思是不为">"的字符,然后[^>]+中的“+”是匹配一次或者多次,也就是一直匹配到不为">"字符,然后呢,再把">"字符加上,就是最终的匹配结果了。呵呵

补充:Regex.Replace(TempContent,"<[^>]*>","")
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: