Java中怎么简单的使用正则表达式?
2016-02-12 20:14
260 查看
对于正则表达式,我通常的认识就是通过一些陌生的奇怪的符号就可以完成很复杂事件的好帮手!实际上正则表达式确实是这方面的好助手,接下来让我们一起认识一下Java中怎么使用正则表达式吧。
— Pattern位于java.util.regex.Pattern.是使用正则表达式的主角。在帮助文档上有这样的一段描述:
— 我们不难发现,使用pattern主要是先放入“正则匹配表达式”,然后调用了其matcher方法。如下:
—然后可以看到其返回值类型是一个Matcher对象,那么什么是Matcher呢?
。
—原来如此,获得了matcher对象,只需要调用其成员方法就可以知道正则表达式的匹配的结果了。这样我们也就完成了匹配的操作了!
首先是用做敏感词汇的敏感词库,里面设置了三个级别的敏感词,各种含义是:
1代表禁止词语,不能对外显示
2代表审核词语,需要管理员的审核
3代表替换词语,我们要对这些词语进行替换操作
下面是使用代码进行演示的效果,处理逻辑是
读取词库中的数据,然后按照词库中词语特点将不同级别的敏感词放到不同级别的“容器”中,方便待会的匹配
使用正则表达式让目标词语一一与敏感词库进行对比
获得匹配结果,并进行输出操作。
测试结果:
只做了一个级别的敏感词处理,做的并不完善
使用集合作为敏感词容器,仅适合小型的敏感词处理,不适合大规模的处理。
优点:
较好的使用到了正则表达式对测试内容进行了处理。
初见Pattern
使用的步骤如下:— Pattern位于java.util.regex.Pattern.是使用正则表达式的主角。在帮助文档上有这样的一段描述:
— 我们不难发现,使用pattern主要是先放入“正则匹配表达式”,然后调用了其matcher方法。如下:
—然后可以看到其返回值类型是一个Matcher对象,那么什么是Matcher呢?
。
—原来如此,获得了matcher对象,只需要调用其成员方法就可以知道正则表达式的匹配的结果了。这样我们也就完成了匹配的操作了!
使用正则表达式匹配处理敏感词汇
这里仅仅是一个简单的演示Demo,所以并不是很全面。首先是用做敏感词汇的敏感词库,里面设置了三个级别的敏感词,各种含义是:
1代表禁止词语,不能对外显示
2代表审核词语,需要管理员的审核
3代表替换词语,我们要对这些词语进行替换操作
fuck|1 damet|2 soft|3
下面是使用代码进行演示的效果,处理逻辑是
读取词库中的数据,然后按照词库中词语特点将不同级别的敏感词放到不同级别的“容器”中,方便待会的匹配
使用正则表达式让目标词语一一与敏感词库进行对比
获得匹配结果,并进行输出操作。
package regex; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.junit.Test; /** * 用于测试正则表达式的内容 * @author Summer * */ public class RegexDemo { private static List<String> banList = new ArrayList<String>(); private static List<String> authList = new ArrayList<String>(); private static List<String> changeList = new ArrayList<String>(); public static void main(String[] args) { //初始化敏感词汇并进行加载 try { File file = new File("src/words.txt"); BufferedReader reader = new BufferedReader(new FileReader(file)); String line = ""; while((line=reader.readLine())!=null){ String []s = line.split("\\|"); if(s[1].trim().equals("1")){ banList.add(s[0].trim()); } if(s[1].trim().equals("2")){ authList.add(s[0].trim()); } if(s[1].trim().equals("3")){ changeList.add(s[0].trim()); } } } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } //测试敏感词汇 String testString = "fuck"; for(Object reg : banList.toArray()){ Pattern pattern = Pattern.compile(reg.toString()); Matcher matcher = pattern.matcher(testString); if(matcher.find()){ System.out.println("对不起,敏感词汇!"); return; }else{ System.out.println(testString); } } } }
测试结果:
总结
缺点:只做了一个级别的敏感词处理,做的并不完善
使用集合作为敏感词容器,仅适合小型的敏感词处理,不适合大规模的处理。
优点:
较好的使用到了正则表达式对测试内容进行了处理。
相关文章推荐
- Java中怎么简单的使用正则表达式?
- Notepad++自动格式化Java代码
- Java的多线程之同步篇三:同步阻塞、监视器、volatile、final、原子性、线程局部变量、锁测试与超时、读写锁
- 20个非常有用的Java程序片段
- java基础15集合List
- Java序列化示例
- 我就是试试Java中的Socket
- Spring
- Struts 2
- 华为机试题: 求n!中含有0的个数(JAVA)
- Java回调机制
- java注释模板
- Notepad++直接编译运行Java
- 深入理解Java虚拟机----(十一)线程安全与锁优化
- The Java™ Tutorials — Concurrency :Synchronized Methods 同步方法
- java基本数据类型及相互间的转换
- Java正则表达式特殊字符
- java基础15迭代器
- Windows 安装 JDK 环境变量设置
- How to solve “Dynamic Web Module 3.1 requires Java 1.7 or newer” in Eclipse