C#常用正则过滤
2016-04-13 14:43
267 查看
//string regexstr = @"<[^>]*>"; //去除所有的标签 //@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除 html = Regex.Replace(html, "<script[^>]*>([\\s\\S]*?)</script>", "", RegexOptions.IgnoreCase); html = Regex.Replace(html, "<a([^>]*)>([^<]+)</a>", "$2", RegexOptions.IgnoreCase);//过滤a链接,只留a内容 // string regexstr = @"<img[^>]*>"; //去除图片的正则 // string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br // string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容 string regexstr = @"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
相关文章推荐
- C#多线程开发
- C#排序--Linq方法
- C#索引器
- Codeforces 653A C#写算法题
- C#控件及常用属性整理【详细版】
- C#常见设置方法
- C#浮点数保留两位小数的方法
- C#默认以管理员身份运行程序
- C#枚举硬件设备(升级版)
- C# 访问USB(HID)设备
- C#按日期年月日分別寫入記錄
- C#版 Socket编程(最简单的Socket通信功能)
- C# Socket编程 同步以及异步通信
- C# 读取数据表没有主键的问题
- Skyline创建三维管线两种方式(C#)
- [译]C#编码约定
- C#基础总结
- 用Open XML SDK 获取PPT标题和内容(C#)
- 转:C# 读取EXCEL文件的三种经典方法
- C#学习笔记---方法