敏感词过滤
2017-07-21 11:42
381 查看
为了净化网络环境,我们很多公司都会要求对敏感词汇在文章中进行过滤。
这里介绍下敏感词过滤方式。
// ‘为什么’ ‘上学’ ‘爱劳动’ 是敏感词 将敏感词变成*
$str = "太阳当空照花儿对我笑 小鸟说早早早 你为什么背上小书包 我要上学校天天不迟到 爱学习爱劳动 长大要为人民立功劳";
$sensitiveWords = array('为什么', '上学', '爱劳动');
echo str_replace($sensitiveWords, array_fill(0, count($sensitiveWords), '**'), $str);这个用的是str_replace 虽然能解决问题,但是效率低下。
下面介绍一个性能相对不错的做法(性能大概比str_replace高4倍左右)
// ‘为什么’ ‘上学’ ‘爱劳动’ 是敏感词 将敏感词变成*
$str = "太阳当空照花儿对我笑 小鸟说早早早 你为什么背上小书包 我要上学校天天不迟到 爱学习爱劳动 长大要为人民立功劳";
$sensitiveWords = array('为什么', '上学', '爱劳动');
echo strtr($str, array_combine($sensitiveWords, array_fill(0, count($sensitiveWords), '**')));
这种主要依赖strtr函数。
下面介绍下本专题中用到的函数:
1、创建一个数组,用一个数组的值作为其键名,另一个数组的值作为其值 array_combine
2、用给定的值填充数组
array_fill
3、子字符串替换 str_replace
4、转换指定字符 strtr
以上是真的敏感词过滤的一些个人的解决方案。在这个开源的时代,自己写的很少了,上面内容也就是帮助大家理解而已。第三方服务为我们提供了强大的过滤服务,直接引用就好。具体服务很多,比如网易的(不是广告
)。
这里介绍下敏感词过滤方式。
// ‘为什么’ ‘上学’ ‘爱劳动’ 是敏感词 将敏感词变成*
$str = "太阳当空照花儿对我笑 小鸟说早早早 你为什么背上小书包 我要上学校天天不迟到 爱学习爱劳动 长大要为人民立功劳";
$sensitiveWords = array('为什么', '上学', '爱劳动');
echo str_replace($sensitiveWords, array_fill(0, count($sensitiveWords), '**'), $str);这个用的是str_replace 虽然能解决问题,但是效率低下。
下面介绍一个性能相对不错的做法(性能大概比str_replace高4倍左右)
// ‘为什么’ ‘上学’ ‘爱劳动’ 是敏感词 将敏感词变成*
$str = "太阳当空照花儿对我笑 小鸟说早早早 你为什么背上小书包 我要上学校天天不迟到 爱学习爱劳动 长大要为人民立功劳";
$sensitiveWords = array('为什么', '上学', '爱劳动');
echo strtr($str, array_combine($sensitiveWords, array_fill(0, count($sensitiveWords), '**')));
这种主要依赖strtr函数。
下面介绍下本专题中用到的函数:
1、创建一个数组,用一个数组的值作为其键名,另一个数组的值作为其值 array_combine
2、用给定的值填充数组
array_fill
3、子字符串替换 str_replace
4、转换指定字符 strtr
以上是真的敏感词过滤的一些个人的解决方案。在这个开源的时代,自己写的很少了,上面内容也就是帮助大家理解而已。第三方服务为我们提供了强大的过滤服务,直接引用就好。具体服务很多,比如网易的(不是广告
)。
相关文章推荐
- 过滤敏感词汇---HttpServletRequest对象增强
- 利用PHP扩展trie_filter做中文敏感词过滤
- 过滤器(Filter)应用之------设置页面缓存、用户的自动登录和敏感词过滤
- PHP 敏感词汇过滤
- Java实现敏感词过滤
- Python实现敏感词过滤替换
- lua写的敏感词过滤
- PHP实现过滤留言信息中的敏感词
- DFA算法过滤敏感词,替换为*
- python 敏感词过滤
- web前端js过滤敏感词
- 敏感词过滤-AC自动机
- Msyql过滤敏感词汇语句
- Java服务端过滤敏感词的思路
- DFA算法实现过滤多家公司自定义敏感字
- UGC社区敏感词过滤原理
- java-读取文件,过滤敏感字符后生成新文件
- 《高效精准》敏感字&词过滤
- php过滤敏感词实例代码
- Java敏感词过滤MFC版发布