lua string.byte 中文处理
2015-10-09 10:36
597 查看
在utf-8编码里,一个汉字通常占3个字节,在ansi(GBK)编码里,一个汉字占2个字节
string.byte(char) > 127则代表是中文,如果是utf-8编码,则分割字符用string.sub(str , index , index+2),下一个字符位置为index+3
string.byte(char) <=127则代表是普通字符,截取一个字节即可,一个字节就是一个字符,string.sub(str , index , index),下一位是index+1
string.byte(char) > 127则代表是中文,如果是utf-8编码,则分割字符用string.sub(str , index , index+2),下一个字符位置为index+3
string.byte(char) <=127则代表是普通字符,截取一个字节即可,一个字节就是一个字符,string.sub(str , index , index),下一位是index+1
相关文章推荐
- 详解Lua中的表的概念及其相关操作方法
- Lua编程示例(二):面向对象、metatable对表进行扩展
- 把Lua编译进nginx步骤方法
- Lua脚本自动生成APK包
- Lua中的元表(metatable)、元方法(metamethod)详解
- Lua中的metatable介绍
- Lua中ipair和pair的区别
- Lua中的函数精讲笔记
- 浅谈Lua的面向对象特性
- 详解Lua中的变量相关知识点
- Lua脚本语言入门笔记
- Lua脚本调用外部脚本
- 详解Lua中的if语句的使用方法
- Lua中调用函数使用点号和冒号的区别
- Lua中的闭合函数、非全局函数与函数的尾调用详解
- Lua中强大的元方法__index详解
- Lua中调用C++函数示例
- Lua面向对象之类和继承浅析
- Lua性能优化技巧(一):前言
- Lua中获取table长度问题探讨