mysql 字符串长度计算实现代码(gb2312+utf8)
2011-12-16 00:00
561 查看
PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:
PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:
$enStr = 'Hello,China!';
echo strlen($enStr); // 输出:12
而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。
gbk编码下每个中文字符所占字节为2,例:
$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出:12
utf-8编码下每个中文字符所占字节为3,例:
$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出:18
那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。
这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):
utf8_strlen – 获得UTF8编码的字符串的长度
PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:
$enStr = 'Hello,China!';
echo strlen($enStr); // 输出:12
而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。
gbk编码下每个中文字符所占字节为2,例:
$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出:12
utf-8编码下每个中文字符所占字节为3,例:
$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出:18
那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。
这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):
$zhStr = '您好,中国!'; $str = 'Hello,中国!'; // 计算中文字符串长度 function utf8_strlen($string = null) { // 将字符串分解为单元 preg_match_all("/./us", $string, $match); // 返回单元个数 return count($match[0]); } echo utf8_strlen($zhStr); // 输出:6 echo utf8_strlen($str); // 输出:9
utf8_strlen – 获得UTF8编码的字符串的长度
/* * 用于UTF8编码的程序 * 获得字符串的长度,一个中文表示3个长度 * itlearner注释 */ function utf8_strlen($str) { $count = 0; for($i = 0; $i < strlen($str); $i++){ $value = ord($str[$i]); if($value > 127) { $count++; if($value >= 192 && $value <= 223) $i++; elseif($value >= 224 && $value <= 239) $i = $i + 2; elseif($value >= 240 && $value <= 247) $i = $i + 3; else die('Not a UTF-8 compatible string'); } $count++; } return $count; }
相关文章推荐
- mysql 字符串长度计算实现代码(gb2312+utf8)
- perl中操作mysql,字符匹配与替换,字符串截取,计算字符长度
- php中计算未知长度的字符串哪个字符出现的次数最多的代码
- 用C语言编写函数,实现strlen计算字符串长度的功能
- 传入字符串,计算字符串长度(用指针实现)
- 解决计算字符串中出现字符字数统计的代码实现
- c实现字符串长度计算
- 写一个MySql存储过程实现房贷等额本息还款计算(另外附javascript代码)
- 仿网易一元夺宝算法,宽长度数据计算,字符串实现
- PHP 实现后缀表达式(接受四则运算字符串,输出计算结果,附代码)
- php中计算未知长度的字符串哪个字符出现的次数最多的代码
- php中计算未知长度的字符串哪个字符出现的次数最多的代码
- 编程实现计算字符串的长度
- Javascript扩展String.prototype实现格式金额、格式时间、字符串连接、计算长度、是否包含、日期计算等功能
- C#和SQL实现的字符串相似度计算代码分享
- java实现 计算字符串最后一个单词的长度,单词以空格隔开。
- 编程实现计算字符串的长度
- jQuery截取指定长度字符串的实现原理及代码
- 华为机试(字符串最后一个单词长度,计算字符串的个数,明明的随机数) Java实现