您的位置:首页 > Web前端 > HTML

去除文本中的HTML标签

2015-11-01 20:57 519 查看
今天在做手机接口出现一个问题:

PC端使用在线编辑器编写的文档存入数据库是带有HTML标签,这些HTML标签在电脑端没有问题,但时在移动端就会显示出HTML的源代码,

如下图数据库中取出的数据:



上面图片中content列中的文本包含有很多HTML标签,这些标签在移动端都会以源代码的形式显示出来,那么应该怎么把这些HTML标签去掉呢?

方法如下:

我们可以先使用正则表达式匹配HTML标签,然后使用replace()方法将匹配到的标签替换掉。

示例代码:

#region 去除HTML标签
private DataTable deleHtml(DataTable dt)
{
for (int i = 0; i < dt.Rows.Count; i++)
{
dt.Rows[i]["content"] = System.Text.RegularExpressions.Regex.Replace(dt.Rows[i]["content"].ToString(), "<[^>]+>", "");

}
return dt;
}
#endregion


Replace()方法有三个参数

第一个是等待检查的字符串。

第二个是检查用的正则表达式。

第三个是正则表达式皮匹配成功后要替换的字符串。

使用上面地方法后得到的结果如下图:



上图中使用了方法后已经没有HTML标签了。。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: