小程序字节转GBK及UTF8
2022-04-24 17:50
2146 查看
前段时间在Android原生搞的BLE扫码枪又要移植到小程序上来。本以为小程序不支持BLE的,结果一搜,还真支持-_-|| 。
蓝牙部分问题不大,遇到的主要问题是,小程序环境如何对字符编码进行判断以及如何进行编码转文字的问题。
扫了一阵,搜到了TextDecoder。结果小程序环境不支持……。
随后搜到了一个polyfill库, 可以用于小程序。
https://github.com/inexorabletash/text-encoding
下载后的文件包含
encoding.js 和 encoding-indexes.js 两个文件。
使用时
//只需要引用encoding.js,注意路径 var encoding = require("../../libs/util/encoding.js"); var inputBuffer = new Uint8Array(); //utf8 var string = new encoding.TextDecoder().decode(inputBuffer); //gbk string = new encoding.TextDecoder("gbk").decode(inputBuffer);
坑:utf8编码数组 是能正确转换的, gbk的不行。(2017 5月 v0.6.3 这个版本) 调试了下,需要修改encoding.js文件,不知道是不是个bug
//849行 return global['encoding-indexes'][name]; //修改为 return global['encoding-indexes']['encoding-indexes'][name];
另,中文编码常用的有两种“GBK”和“utf8”,因此对于输入数组还是要先做编码判断,才能正确转换为文字。js版本的判断utf8的函数也没有搜到合适的,用之前java 的改了下,下面的亲测可用。
isUTF8(buffer) { var isUtf8 = true; var end = buffer.length; for (var i = 0; i < end; i++) { var temp = buffer[i]; if ((temp & 0x80) == 0) { // 0xxxxxxx continue; } else if ((temp & 0xC0) == 0xC0 && (temp & 0x20) == 0) { // 110xxxxx 10xxxxxx if (i + 1 < end && (buffer[i + 1] & 0x80) == 0x80 && (buffer[i + 1] & 0x40) == 0) { i = i + 1; continue; } } else if ((temp & 0xE0) == 0xE0 && (temp & 0x10) == 0) { // 1110xxxx 10xxxxxx 10xxxxxx if (i + 2 < end && (buffer[i + 1] & 0x80) == 0x80 && (buffer[i + 1] & 0x40) == 0 && (buffer[i + 2] & 0x80) == 0x80 && (buffer[i + 2] & 0x40) == 0) { i = i + 2; continue; } } else if ((temp & 0xF0) == 0xF0 && (temp & 0x08) == 0) { // 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx if (i + 3 < end && (buffer[i + 1] & 0x80) == 0x80 && (buffer[i + 1] & 0x40) == 0 && (buffer[i + 2] & 0x80) == 0x80 && (buffer[i + 2] & 0x40) == 0 && (buffer[i + 3] & 0x80) == 0x80 && (buffer[i + 3] & 0x40) == 0) { i = i + 3; continue; } } isUtf8 = false; break; } return isUtf8; }
相关文章推荐
- 按 字节截取分别以GBK 和 utf-8 编码的 字符串的java程序。
- 多字节(一般指GBK) utf8 Unicode 编码互转
- GBK_TO_UTF8 程序实现方式
- 下面哪段程序能够正确的实现了GBK编码字节流到UTF-8编码字节流的转换
- MySQL字符集 GBK、GB2312、UTF8区别 解决 MYSQL中文乱码问题
- 多字节、Unicode和UTF8字符串的互换
- GBK源码转UTF8
- Android NDK的C/C++代码中利用JNI回调实现字符编码转换的试验(中文UTF8与GBK)
- encode_utf8 把字符编码成字节 decode_utf8解码UTF-8到字符
- MySQL字符集 GBK、GB2312、UTF8区别 解决PHP MYSQL中文乱码问题
- 聊聊计算机中的编码(Unicode,GBK,ASCII,utf8,utf16,ISO8859-1等)以及乱码问题的解决办法
- Java实现的utf8,gbk,unicode编码相互转换的代码
- char, wchar_t,UTF8,UNICODE,GBK转换
- 彻底搞清楚字符编码: ASCII, ISO_8859, GB2312,UCS, Unicode, UTF8.(GBK, GB18030, BIG5, UTF-7,UTF-16,UTF-32) .
- 查看修改mysql编码方式让它支持中文(gbk或者utf8)
- GBK与UTF8编码相互转换
- utf8和gbk互转实现
- C实现UTF8和GBK互转---Linux版
- php导出到Excel 或 CSV (附utf8、gbk 编码转换)
- csv文件utf8编码后windows操作系统(中文GBK环境)下乱码