您的位置：首页 > 其它

《30天自制操作系统》实现中文显示

2014-07-27 17:49 225 查看

《30天自制操作系统》实现中文显示

　　《30天自制操作系统》最近一直再看，最近已经看到后面了，看到第28天，里面讲到可以实现对全角字符的支持，而原操作系统代码里面只是支持了日语显示，而中文版的这本书也只是讲了一个思路，具体的实现也是没有的。网上也好像没有人实现过这个吧，我是找不到。(由于书中每一章每一小节都有代码，我看书的时候就懒得去实际写代码，就简单看看。不过这次就可以写一下了，加深对这个系统的了解)反正没事做，就准备实现对这个系统的汉字全角支持。

一、了解HZK编码
　　在改造之前，我们先了解一下符合GB2312标准的中文点阵字库文件的HZK16。百度搜索HZK16第一个那个百度百科连接就是了。
　　HZK16字库是符合GB2312标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个，符号682个。其中一级汉字有3755个，按声序排列，二级汉字有3008个，按偏旁部首排列。我们在一些应用场合根本用不到这么多汉字字模，所以在应用时就可以只提取部分字体作为己用。
　　HZK16字库里的16×16汉字一共需要256个点来显示，也就是说需要32个字节才能达到显示一个普通汉字的目的。
　　我们知道一个GB2312汉字是由两个字节编码的，范围为A1A1~FEFE。A1-A9为符号区，B0到F7为汉字区。每一个区有94个字符（注意：这只是编码的许可范围，不一定都有字型对应，比如符号区就有很多编码空白区域）。下面以汉字“我”为例，介绍如何在HZK16文件中找到它对应的32个字节的字模数据。
　　前面说到一个汉字占两个字节，这两个中前一个字节为该汉字的区号，后一个字节为该字的位号。其中，每个区记录94个汉字，位号为该字在该区中的位置。
　　区码和区号，其实是一个东西
　　区码：区号（汉字的第一个字节）- 0xa0 (因为汉字编码是从0xa0区开始的，所以文件最前面就是从0xa0区开始，要算出相对区码)
　　位码：位号（汉字的第二个字节）- 0xa0
　　这样我们就可以得到汉字在HZK16中的绝对偏移位置：
　　　　offset=(94*(区码-1)+(位码-1))*32
　　注解：　1、区码减1是因为数组是以0为开始而区号位号是以1为开始的
　　　　　　2、(94*(区号-1)+位号-1)是一个汉字字模占用的字节数
　　　　　　3、最后乘以32是因为汉字库文应从该位置起的32字节信息记录该字的字模信息（前面提到一个汉字要有32个字节显示）

二、添加代码
　　首先查看一下c语言里面的中文编码是否真的跟书上讲的是否一样。我们先修改iroha/iroha.c这个文件，代码如下

View Code
运行的结果为
View Code
　　增加一个可以查看效果的程序，我们以chklang/chklang.c这个小程序为例吧。

View Code
　　大概就修改这些了吧，根据书中这样修改，好像也不是很难嘛。好了我们make run一下。结果竟然是？？？？？
View Code
View Code
　　修改putfonts8_asc函数里if (task->langmode == 3)语句块里这两句

putfont8(vram, xsize, x - 8, y, c, font );
putfont8(vram, xsize, x , y, c, font + 16);

　　为

putfont32(vram,xsize,x-8,y,c,font,font+16);

　　终于改完了，应该可以了，有点小激动了，赶快make run一下
View Code
　　　token.h

View Code
　　　上面使用的方法是DFA(确定有限状态自动机)

　　　　上面的图有些指向error的箭头没有标出，不过这个图就大概描述了这个过程。可以自己baidu一些状态机的知识。

　　　　有了这两章的基础就可以自己写个分析器了(作用：以后写应用程序时，要给程序一个配置文件时，可以自己写个脚本进行解析，方便用户书写配置文件。不过现在都使用xml语法了，都还有解析的库呢。都不知道学了以后还有没有机会用到实际中呢)。不过循环和判断就还不能实现。书中后面有讲到，不过看到后面一些内容就有一些力不从心了。感觉难难哒！

　　　　DFA：http://www.cnblogs.com/zhanghaiba/p/3569928.html

　　　　本文地址：/article/6193116.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航