java清除字符串中的html标签
2013-11-14 16:16
549 查看
/** * 去掉字符中的html标签 * @param htmlStr * @return */ public static String StripHTML(String str){ //如果有双引号将其先转成单引号 String htmlStr = str.replaceAll("\"", "'"); String regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; // 定义script的正则表达式 String regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; // 定义style的正则表达式 String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式 Pattern p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); Matcher m_script = p_script.matcher(htmlStr); htmlStr = m_script.replaceAll(""); // 过滤script标签 Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE); Matcher m_style = p_style.matcher(htmlStr); htmlStr = m_style.replaceAll(""); // 过滤style标签 Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE); Matcher m_html = p_html.matcher(htmlStr); htmlStr = m_html.replaceAll(""); // 过滤html标签 return htmlStr.trim(); //返回文本字符串 } public static void main(String[] args) { // System.out.println(StringUtil.replaceBlank("\n\t\tXXX/THA/CHN/MYS/IDN/IND\n\t")); /*String s = "11"; System.out.println(Integer.parseInt(s,16));*/ String htmlStr = "<p> </p><p><br/></p><p><strong>faq添加测试1</strong><em>faq添加测试1</em><strong><span style=\"text-decoration: underline;\">faq添加测试1faq添加测试1</span></strong></p><p><br/></p><p> </p>"; System.out.println(StripHTML(htmlStr)); }
相关文章推荐
- java简单客户端服务器,程序间的简单联系(1)
- Java 线程池的实现
- Sd - Spring
- java线程优先级的简单应用
- java开发安装步骤
- 4个小例子看java线程挂起方法
- struts-2.3.15.3 核心包名称
- java 泛型学习
- Java学习笔记-------集合List
- myEclipse项目转成Eclipse开发
- java--线程认识与实例记录 NO.1
- java线程yield的基本用法
- Sd - Java异常处理
- Sd - JavaBase问题
- Standard Java集合类问题待整理
- struts2 The requested resource is not available.
- JAVA代码:通过Socket读取返回的数据
- java线程的join基本用法
- Struts2环境搭建及实例解析
- Java 反射实例