您的位置:首页 > 编程语言 > C语言/C++

记录一下C++和C#中的字符串处理与编码格式的问题

2015-09-02 10:55 323 查看
下面是字符、字节、编码格式的基础知识: http://www.regexlab.com/zh/encoding.htm
程序中涉及的会有几次的编码格式的转换:
1. 代码文本,字符串是按我们文本设定的编码方式保存的
2. 代码运行期间,字符串在内存中是以一种编码方式保存的
3. 代码如果产生字符串输出,输出到问题的字符串不同的IO类会产生不同编码方式的保存,当然这个可以设置实现更改

因为同一个字符串存在了3次的编码格式切换,所以这里3个地方的实际存储的字节长度会可能不一样。
另外如果对字符串进行字节流处理,要格外小心,不要确认具体的编码方式(汉字:Unicode编码 2字节, UTF8编码3字节,ANSI编码看具体的本地化编码)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: