java敏感词过虑-基于多叉树原理
2015-06-17 10:35
561 查看
基于多叉树的敏感词、关键词过滤的工具包,用于java中的敏感词过滤
1、工具包自带敏感词词库,第一次调用时读入词库,故第一次调用时间可能较长,在类加载后普通pc机上html过滤5000字在80毫秒左右,纯文本35毫秒左右。
2、如需自定义词库,将jar包考入WEB-INF工程的lib目录,在WEB-INF/classes目录下建一个
utf-8的words.dict文本文件,在该文件中以“关键字=级别”的方式写入,比如:
hello=4
word=1
0为级别最小,过滤后返回原字符串中出现的最高级别
调用方法:WordFilterUtil.filterHtml(str,'*');
阅读更多相关文章推荐
- 【java并发】基于JUC CAS原理,自己实现简单独占锁
- IOS 基于APNS消息推送原理与实现(JAVA后台)--转
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- IOS 基于APNS消息推送原理与实现(JAVA后台)--转
- Java基于微信公众号接口实现授权登录源码及原理分析
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- IOS基于APNS消息推送原理与实现(JAVA后台)
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- 基于Java实现的Base64加密、解密原理代码
- Xianfeng轻量级Java中间件平台:基于RBAC模型实现权限控制的原理
- IOS 基于APNS消息推送原理与实现(JAVA后台)
- 基于jCOM搭建Java-微软信息桥梁 jcom原理介绍
- iOS 基于APNS消息推送原理与实现(JAVA后台)
- (转)IOS 基于APNS消息推送原理与实现(JAVA后台)
- Xianfeng轻量级Java中间件平台:基于RBAC模型实现权限控制的原理
- 基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程
- 基于SSM的Java Web应用开发原理初探
- 基于PCA的人脸识别系统(JAVA版)(二) PCA原理介绍