C++ 自然语言编码详解系列二(字符(串)的内存表示)
2007-12-24 14:16
405 查看
字符在内存中是怎样存储的
单字节字符串:每个字符占一个字节按顺序依次存储,最后以单字节表示的0结束。例如。"Bob"的存贮形式如下:42 | 6F | 62 | 00 |
B | o | b | BOS |
42 00 | 6F 00 | 62 00 | 00 00 |
B | o | b | BOS |
一眼看上去,DBCS 字符串很像 SBCS 字符串,但是我们一会儿将看到 DBCS 字符串的微妙之处,它使得使用字符串操作函数和永字符指针遍历一个字符串时会产生预料之外的结果。字符串"日本语 " ("nihongo")在内存中的存储形式如下(LB和TB分别用来表示 leading byte 和 trail byte)
93 FA | 96 7B | 8C EA | 00 |
LB TB | LB TB | LB TB | EOS |
日 | 本 | 语 | EOS |
相关文章推荐
- C++ 自然语言编码详解系列三(各种编码的统一)
- C++ 自然语言编码详解系列一(字符编码基础)
- C/C++开发语言系列之8---C++内置函数详解
- C/C++开发语言系列之9---C++函数模板详解
- 【Linux C/C++系列教程】 第一讲 HelloWorld程序内存分区详解
- C++字符串系列1:字符编码基础
- iconv C++ 实现 字符 (语言) 编码 转换
- C++语言笔试题目写一个函数计算当参数为n(n很大)时的值 1-2+3-4+5-6+7......+n&字符指针、浮点数指针、以及函数指针占用的内存等
- C++ 自然语言编码问题
- 好文章系列C/C++——图说C++对象模型:对象内存布局详解
- C/c++语言中 float double在内存中的存储结构详解
- 关于几种编码详解(Unicode,UTF-8,GB系列)
- C++编码中减少内存缺陷的方法和工具(转载)
- C++内存分配方式详解——堆、栈、自由存储区、全局/静态存储区和常量存储区
- c/c++学习系列之内存对齐
- C和C++中的基本数据类型的大小及表示范围详解
- c++内存中字节对齐问题详解 [ 转载 ]
- JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础[引]
- C++ 内存分配(new,operator new)详解
- 关于C++字符 以及编码 宽字符