PHP实现通过中文字符比率来判断垃圾评论的方法
2014-10-20 00:00
417 查看
本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的PHP程序设计有所帮助。
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
$len_all = strlen($comment['text']); $len_st = mb_strlen($comment['text'], 'UTF-8'); if(($len_all-$len_st)/(2*$len_st) < 0.5){ $error = "中文字符少于百分之五十"; }
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的PHP程序设计有所帮助。
相关文章推荐
- PHP实现通过中文字符比率来判断垃圾评论的方法
- php实现中文字符截取防乱码方法汇总
- PHP用strstr()函数阻止垃圾评论(通过判断a标记)
- php实现中文字符截取防乱码方法汇总
- PHP用strstr()函数阻止垃圾评论(通过判断a标记)
- php实现不通过扩展名准确判断文件类型的方法【finfo_file方法与二进制流】
- php 判断是否有中文字符的两种方法
- web签名验证程序【跨服务器、中文字符签名方法】-php为例
- PHP实现检索字符出现次数的查询方法
- php读取mssql日期出现中文字符的解决方法
- 网络判断网络连接有多种办法,通过C#程序也可以判断与远程主机的连接状态。具体实现方法
- PHP实现的中文转拼音的方法
- PHP中实现数字金额到中文大写字符的转换
- 用PHP来截取中文字符串而不出现乱码的实现方法
- C#: 中文和UNICODE字符转换方法 及仿安居客地图实现。。。错误 GMap2未定义 解决办法 -VB 中文转为UNICODE字符
- C# 判断中文字符的8种方法
- php处理字符串,判断是否含有特殊符号,非中文,数字,字符
- php判断字符以及字符串的包含方法属性
- php mssql 日期出现中文字符的解决方法
- C# 判断中文字符的8种方法