您的位置:首页 > Web前端 > HTML

去除html发现的问题以及解决

2012-03-13 11:04 423 查看
网页中去除html标记的需求,但出现了一些奇怪的事

第一种方法

using System.Text.RegularExpressions;

具体的方法:

public static string RemoveStyle(string str)

    {

        var reg = new Regex(@"\s*style\s*=\s*(['|""]).*?\1", RegexOptions.IgnoreCase);

        return reg.Replace(str,"");

    }

 

但远程的虚拟主机一直其实,未加载组件Regular  郁闷

 

技术想了一个解决办法,证明可行

第二种:

 public static string DelHTML(string html)//将HTML去除

{           

 System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex(@"\s*style\s*=\s*(['|""]).*?\1", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        html = regex1.Replace(html, ""); //过滤<script></script>标记

        return html;

    }

 

这个可行,真是奇怪!

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  html regex string
相关文章推荐