您的位置:首页 > 编程语言 > Java开发

高效敏感词过滤JAVA实现(DFA算法)

2015-11-08 16:49 901 查看
高效敏感词过滤JAVA实现(DFA算法) 5000字2ms
节点 + 2进制标识(节省空间/提高查询效率)
附源码、注释,附带专业敏感词库(3396个敏感词)
 
思路:    创建一个FilterSet,枚举了0~65535的所有char是否是某个敏感词开头的状态
 *             
 *             判断是否是 敏感词开头
 *             |                               |
 *             是                          不是
 *         获取头节点             OK--下一个字
 *     然后逐级遍历,DFA算法

源码下载地址:   http://download.csdn.net/download/acbdee/9578824 
普通PC测试结果:	2015-5-1
加载时间 : 41542826ns
加载时间 : 41ms
解析字数 : 5000
解析时间 : 2295131ns
解析时间 : 2ms
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息