[转贴] GF汉化详细教程[游戏字体篇]

shane007 · 发表于 2008-10-6 10:37

现在的游戏大部分是用矢量字体了，但以前的游戏一般都是用点阵字体。下面先介绍一下点阵字体显示原理。

汉字内码
　　点头表示什么？是“对”、“YES”，偏偏有的地方表示的意义却恰恰相反。一个动作，有不同的诠释；一个问题，有不同的答案；而一个符号，却有不同的意义，关键在于：你是如何地理解。在电脑中亦如此，所有的数据都是以0和1保存的，按不同的数据操作，可以得到不同的结果。对于显示英文操作，由于英文字母种类很少，只需要8位（一字节）即可。而对于中文，常用却有5000以上，于是我们的DOS前辈想了一个办法，就是将ASCII表的高128个很少用到的数值以两个为一组来表示汉字，即汉字的内码。而剩下的低128位则留给英文字符使用，即英文的内码。

汉字字模
　　得到了汉字的内码后，还仅是一组数字，那又如何在屏幕上去显示呢？这就涉及到文字的字模，字模虽然也是一组数字，但它的意义却与数字的意义有了根本的变化，它是用数字的各位信息来记载英文或汉字的形状，如英文的'A'在字模中是这样记载的：

而中文的“你”在字模中却是这样记载的：


所有的汉字字模组成点阵字库，像以前Dos下常用的Ucdos汉字系统就是用的点阵字库，点阵字库根据不同需要有好多种尺寸，如16*16 24*24，点越多显示的字越细致，特别是显示那些笔划比较多的字，效果越好。

下面进入GF字体的世界，GF的字体扩展名是.LAF，都打包存储于Data000.LAB文件中。先分析一下LAF的文件格式，然后再讨论如何在字库中加入中文。LAF格式由文件头、字体索引表、字体偏移量表、字体点阵四部分组成。

1．  文件头(32字节)

字段
数据长度
描述

Charnum
Long(4字节)
字库中字体个数

fontsize
Long(4字节)
字体点阵部分的数据长度

MaxWidth
Long(4字节)
字体最大宽度

MaxHeight
Long(4字节)
字体最大高度

Unknown
Long(8字节)
未知

FirstChar
Long(4字节)
第一个字符编码

LastChar
Long(4字节)
最后一个字符编码



2．  字体索引表

与字体编码范围相对应，每个双字节保存一个字模在偏移量表中的偏移量。如GF的英文字库是显示ASCII码表中0-FF的字符，所以有256个字模，字体索引表有256*2 =512字节。保存内容为这256个字模在字体偏移量表中的偏移量

3．  字体偏移量表(与字体个数一一对应)

字段
数据长度
描述

Offset
Long(4字节)
此字模相对字体点阵的偏移量

Unknown
Long(4字节)
未知

Width
Long(4字节)
字模宽度

Height
Long(4字节)
字模高度



4．  字体点阵

保存字体点阵。字体点阵的保存顺序是，从左到右，从上到下。0代表无点，ff代表有点。(这是GF点阵与一般字体点阵的区别，一般字体点阵一个二进制位的1代表一个点，但是GF的字库0xFF才代表一个点)。

现在举一个GF中的点阵的例子，下图是GF中汉字“选”的点阵，可以基本看出字形吧，每个汉字都要做成这样的点阵加入到字库中去。



现在举一个例子，说明GF程序如何显示一个英文字母N。(N的ASCII码是0x4E)

1．  在字体索引表中找到字模在偏移量表中的偏移量。读文件32+4E*2 = 0xBC处的双字，得到偏移量4E。

2．  在字体偏移量表中得到字体点阵的偏移量。读文件32+512+4E*16 = 0x700处得到字体点阵的偏移量0x17c0，再读0x708h得到字体N的宽0x0A，再读0x70ch处得到字体N的高0x0C。

3．  读字体点阵显示字符N。字体点阵的首地址为16*256+512+32 = 0x1220H。字体N的点阵部分是在文件0x1220H+0x17c0H到0x1220H+0x17c0H+0D*0A之间。



汉字编码GB2312-80简介

GB2312码是中华人民共和国国家汉字信息交换用编码，全称《信息交换用汉字编码字符集——基本集》，由国家标准总局发布，1981年5月1日实施，通行于大陆。新加坡等地也使用此编码。

　　GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符，其中汉字占6763个。GB2312规定“对任意一个图形字符都采用两个字节表示，每个字节均采用七位编码表示”，习惯上称第一个字节为“高字节”，第二个字节为“低字节”。

　　GB2312将代码表分为94个区，对应第一字节；每个区94个位，对应第二字节，两个字节的值分别为区号值和位号值加32（2OH）,因此也称为区位码。01-09区为符号、数字区，16-87区为汉字区，10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级：第一级是常用汉字计3755个，置于16-55区，按汉语拼音字母/笔形顺序排列；第二级汉字是次常用汉字计3008个，置于56-87区，按部首/笔画顺序排列。故而GB2312最多能表示6763个汉字。

GB2312的编码范围为2121H-777EH，与ASCII有重叠，通行方法是将GB码两个字节的最高位置1以示区别。

改造字库

我们现在要做的就是将GB2312中的6763个汉字加入到GF的字库中去。汉字点阵定为16*16。因为游戏中仍要部分内容要以英文方式显示，所以我们加入汉字并不应该破坏原有的英文点阵字库，而是应该在英文字库尾部追加这6763个汉字。

1．  首先要修改文件头部分，每个字段都要做相应调整。

2．  由于汉字编码范围是2121H-777EH，所以字体索引表至少要扩大为777E*2个字节。索引表的内容前512字节为原始的英文字体索引表，应该保留。在此之后，凡遇到字体索引表中GB2312汉字编码处是汉字的位置，添加汉字在字体偏移量表中的偏移量。汉字偏移量应该从0x100开始(前256是英文字库)

3．  重建字体偏移量表，将6763个汉字在字体点阵的偏移量、汉字宽0x10，汉字高0x10写入。

4．  将6763个汉字的点阵追加到原来英文点阵的尾部。

经过以上4部，字库改造完毕。虽然修改只有4部分，但是每部分都涉及到各种偏移量的计算，多字节高低位的读取等、文件头的再修改等步骤，代码实现起来非常麻烦，稍有不甚就会失败，甚至导致GF运行时直接崩溃，调试时需要特别的耐心才行。

在生成新的字库后，把新字库覆盖掉原来Data000.LAB中的同名字库文件，字库的修改就大功告成了。

firendless · 发表于 2009-3-17 16:53

不需要考虑高低位问题，程序自己会搞定，比如储存65534[&hFFFE] 用程序来做会自动储存为FE FF

[转贴] GF汉化详细教程[游戏字体篇]

[转贴] GF汉化详细教程[游戏字体篇]

楼主热贴

社区热点

浏览过的版块