java/android 正则表达式去除所有HTML标签
2017-05-17 10:56
1626 查看
protected string str = "<table><tr><td>sdasasdsdd</td></tr></table><br><p>sds</p><img id='img1' src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''>aaassss<br><img src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50'
alt=''> 说是道 ";
protected void Page_Load(object sender, EventArgs e)
{
//string regexstr = @"<[^>]*>"; //去除所有的标签
//@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
// string regexstr = @"<img[^>]*>"; //去除图片的正则
// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br
// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
string regexstr = @"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
}
alt=''> 说是道 ";
protected void Page_Load(object sender, EventArgs e)
{
//string regexstr = @"<[^>]*>"; //去除所有的标签
//@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
// string regexstr = @"<img[^>]*>"; //去除图片的正则
// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br
// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
string regexstr = @"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
}
相关文章推荐
- C# 正则表达式,去除所有HTML标签
- 正则表达式,去除所有HTML标签
- [转]正则表达式,去除所有HTML标签
- 利用正则表达式实现去除所有HTML标签代码
- android 通过正则表达式遍历html中所有的img标签
- Java去除掉HTML里面所有标签的两种方法——开源jar包和自己写正则表达式
- 正则表达式,去除所有HTML标签
- 正则表达式,去除所有HTML标签
- java正则表达式去除html中所有的标签和特殊HTML字符(以&开头的)
- asp.net 正则表达式过滤所有html标签
- java正则表达式去除html标签
- python正则表达式去除html标签
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- 去除网站中HTML标签的正则表达式
- asp.net正则表达式提取网页网址、标题、图片,滤所有HTML标签
- 【转】java使用正则表达式去除字符串的html标签
- 正则表达式,替换所有HTML标签
- C#去除一段字符串内的HTML标签,正则表达式
- 正则表达式去除html标签
- java代码用正则表达式去除html标签