首先,分析游戏的文字显示方式。玩游戏的时候最怕打开游戏看到一片乱码,现在汉化游戏却是最希望打开游戏看到一片乱码,因为一般在非日文环境下能正常显示日文的游戏都使用的字符集限定,为汉化增加了不少的难度……
" D) }) F/ i& b一起采取Textout方式的年代,日文、繁体中文十个有九个是乱码,于是有了Apploc和NL,后来比尔大叔推出了CreateFontA函数……CreateFontA能够直接定义程序使用和操作系统不同的字符集,于是乱码没有了,而汉化者噩梦开始了,因为汉化后的中文内容在经过日文字符集的编译后变为日语状态下的乱码。 ' d% s* V/ \2 V6 v
以下是比尔大叔的MSDN Library对CreateFontA给出的函数原形 " {" R. I& m! [ Q) K* C: `
* q3 }9 W$ H/ C+ s$ aHFONT CreateFont( 5 e5 R3 v5 {3 `* t$ `# c D
int nHeight, // height of font 7 `* U# R7 a9 D, z& V- v4 c- r2 B
int nWidth, // average character width 7 K, N; n1 A' q0 G# l- h
int nEscapement, // angle of escapement
. d% M! m$ n( S) H3 E1 Y; oint nOrientation, // base-line orientation angle
# t! p# E9 E2 ^* ~int fnWeight, // font weight 2 v8 H- s3 w7 v% u9 R+ Y
DWORD fdwItalic, // italic attribute option
& O: F" s. t2 p+ k$ s( n% x W# `DWORD fdwUnderline, // underline attribute option ( S% y" Y# S9 o# H, |; F& m# v X
DWORD fdwStrikeOut, // strikeout attribute option
/ F* Y- [( E9 B& z; {DWORD fdwCharSet, // character set identifier 7 s2 j; ~, b' j. N D6 z) a1 m
DWORD fdwOutputPrecision, // output precision ' x o1 G' H! y- N. |/ \" t, b
DWORD fdwClipPrecision, // clipping precision : j1 R" t3 K2 z. V) D5 Z7 S
DWORD fdwQuality, // output quality ; y' k, S! i, Y* @/ I
DWORD fdwPitchAndFamily, // pitch and family
+ V# Y9 y7 W! B* m( z- f4 CLPCTSTR lpszFace // typeface name 1 K, W6 h+ T6 d* g
);
! ]/ Q9 ^. x0 M( n0 A% E! x7 S
* _/ A+ o0 R7 ?& C2 u+ IHFONT CreateFontIndirect(
: W, ?5 ^& \) bCONST LOGFONT* lplf // characteristics
$ O5 W% S6 Q8 T* W" K( ^: B+ e); w# v- m4 Q2 a4 Q0 w* c8 ^
其中 LOGFONT的声明如下: . y9 Y x, p% D8 x6 i% J
# E- p; f2 d4 v) b
typedef struct tagLOGFONT { 0 y6 Q$ `4 i K4 ?5 o3 J
LONG lfHeight;
' |" W" t3 M, c( e1 i* m+ C5 QLONG lfWidth;
& _8 \- w2 J+ r* h! @9 s; iLONG lfEscapement;
) S6 ^( A9 P/ c8 L* R3 eLONG lfOrientation;
+ Z( P' U% D$ wLONG lfWeight; ' h# J" S1 F4 w2 S* _
BYTE lfItalic;
, R5 s5 X0 H4 X8 _" v8 ~0 HBYTE lfUnderline; 7 w+ M+ L% T, k% J( L9 I
BYTE lfStrikeOut; , Z" t; @6 v! Z. j' m
BYTE lfCharSet; . h" h4 ^" p: ]; a) M- B
BYTE lfOutPrecision;
7 g" w/ Y- r8 x- ^, _6 X- GBYTE lfClipPrecision; " q$ _3 S. }% E
BYTE lfQuality; , O* c) g2 X6 s3 R B }
BYTE lfPitchAndFamily;
- [5 T+ A) f# X @7 e7 Q; ATCHAR lfFaceName[LF_FACESIZE];
5 ~( b. P- k2 s: U& m6 Z} LOGFONT, *PLOGFONT;
+ k& s" R% S% _) C8 q& k==================分割线=================
' ^' I2 z# `; l5 {2 R$ n/ I要改变程序支持的字符集,就要改变程序调用上面两个函数时的fdwCharSet或lfCharSet的值
1 E" C$ r5 F. Z5 k. |# B其中各字符集所对应的值如下:
. Q, j9 ?/ F7 K$ n9 X8 K+ S6 x4 p& |/ O% x$ A# A9 E$ R
字符集 值(十进制) 2 a$ t- a* r* j$ g& [) N" E# P8 u% Y
ANSI_CHARSET 0
6 `: F+ Q9 B$ r# KDEFAULT_CHARSET 1
/ d( M& o& o1 F- l1 h5 s4 YSYMBOL_CHARSET 2 / r. w8 m& I1 x
MAC_CHARSET 77
2 }' V" S: I/ Z1 G8 J& p6 `SHIFTJI_CHARSET 128
) n! E2 U) U+ i& U2 I+ a& X, J4 `HANGEUL_CHARSET 129 - ^' w- ]6 `! Z t: s+ V; B0 i. c
HANGUL_CHARSET 129
) X3 ?. y( t; R& QJOHAB_CHARSET 130
. p" `- H' ]6 D. y: O( P2 a; MGB2312_CHARSET 134
1 k2 ?% B) L {) `CHINESEBIG5_CHARSET 136
' _& T- H0 e) PGREEK_CHARSET 161 " U( R0 a$ Q0 m2 ^
TURKISH_CHARSET 162 - k2 W# h& |5 Z
VIETNAMESE_CHARSET 163 ; G6 U G) |; T ~" `
HEBREW_CHARSET 177
; n- J: z" X/ w* VARABIC_CHARSET 178
9 I, \# N1 l @* e3 E% F, yBALTIC_CHARSET 186
7 d( c; K& {* C* \. J8 ~% r3 s' zRUSSIAN_CHARSET 204 8 }5 H9 p$ r+ o8 h# f& U
THAI_CHARSET 222 . G4 Q% v" O$ T: A) C; i/ n/ g
EASTEUROPE_CHARSET 238
/ V/ t9 ~) S, m. ~# B1 rOEM_CHARSET 255 : I9 s) s" C) C$ J F$ c: o
可以看到简体中文是86(Hex),日语是80(Hex),繁体中文是88(Hex)
' b9 _& k3 A4 c5 c. i* |- B5 H我们要做的就是找到游戏中定义调用字符集的部位,将80改为86,这样就能让程序正确的显示中文。
4 f- U4 B/ e" G2 E N A9 v0 \5 l" {" Q用pexplorer打开HANABIRA.exe,进入反编汇模式,查找Font字符串,我们发现调用CreateFontA函数的位置是唯一的:
2 Z) o6 F7 q! D5 k# f+ D于是在以下代码我们停下来 ! X& s( K( A7 B
L0041E365: 7 H. W% [9 {5 n& A
mov edi,[esp+14h]
7 A- y, ^ {/ M4 P0 pmov ebx,[esp+28h]
, K) f& u) P8 k/ I m4 {" E$ X/ imov ebp,[esp+24h] ( K2 Y& g& e" ~* J7 \
mov eax,[esp+20h]
) ^ O& ]- r) s! {8 e! cmov ecx,[esp+1Ch]
5 q/ T4 i$ ?) Z8 ]7 d. r, s3 Gpush edi , `6 n8 M/ P, D0 o2 ?
mov edx,[esp+30h] 0 o7 J& V+ v# f5 h. Z7 m l4 n
push 00000031h
/ ~" ^ j E8 o; upush 00000002h
n) U6 O* ~0 ]$ u2 E! vpush 00000000h % F2 T3 U8 h% C* T6 N
push 00000000h " r f; }7 u" P" y, w4 a9 S
push 00000080h # {) j8 @) l V' ~
push ebx
! a. G4 B7 u# epush ebp
# Y) ?2 w7 _; i6 {9 `; epush eax ) Q: d0 Q8 k6 J/ \1 p. _
mov eax,[esp+3Ch]
2 I& O4 A# B) P/ }: q p6 apush ecx 6 |; l1 \ j7 f( Z6 r4 ^( X, @
push 00000000h
" {. K: |4 c9 H0 ^: M+ |. E" G! Ipush edx
3 \1 J0 h; t. j1 N8 Gpush 00000000h 1 Q/ S! z' d3 ]5 @2 {
push eax 4 @; f) E6 d( o P
call [GDI32.dll!CreateFontA]
3 `! Z2 }& v+ W; G o. v3 h. Xlea ecx,[esi+28h]
, q9 O9 b; ^& b3 Qmov [esi+00000138h],eax # H) O- f5 q8 Z: I/ J" [ Q
mov eax,edi # r2 R& w* t' c J
sub ecx,edi 6 S6 @, U2 [$ T5 b, G4 b$ O6 E, T
lea esp,[esp+00h] 5 r1 `" D# q% [
注意这就是调用GDI32.dll中的CreateFontA函数了,我们在这个堆栈中寻找将80这个值传递给CreateFontA的部位。
! e, O0 g$ j8 q: o R7 _, D0 G8 fpush 00000080h . W: Y% r3 J+ s2 C
就是这里将80值压入传递中 5 q/ k+ m B9 ~' l8 ~
PE中标记了这段赋值的Hex数值,用UE打开文件,找到
+ m2 i6 k, b* a1 a) P( R6 o5 p68800005355 ' c- X3 a; ` ~ Z. v2 A) E
将其改为 " h N. @8 R$ d7 H/ Z1 u% S
68860005355 7 Y( B4 z! y% q
保存之。
5 J. Z! C# f P# y; K这样PE中看到这段压入就成了
; \8 |) P: q- R( H, o" Gpush 00000086h . I& e+ l' B. T
初战告破,运行游戏,你会看到日文全变成了乱码,说明程序已经在使用中文的字符集了 0 J8 R# {/ o" {; H4 w6 ]* t5 Z
修改游戏脚本,加入几个中文看看…… 6 P& t2 ?0 I% O) b: k
为什么我添加的中文全部是“□”?
* K! j" M# ]7 D这就是需要解决的第二关卡,字符集边界检查。
& v; d0 X' x( O& K, b
2 B) u& p* b" x既然已经设定了字符集,为什么还要边界检查呢?这是为了防止当游戏文本中含有某些非法的字符串时产生缓存溢出。于是在字形传递到GDI32.dll描绘字体准备显示在屏幕之前对其进行检查,发现超出了设定的缓存大小就将其拦截下来,于是屏幕上就显示出一个“□”。我们知道,由于日文的字符比中文少得多,所以这个缓存也小的多,换言之就是边界太窄。 6 i. I7 q1 w: ^- Q, P
边界检查的例子: % W+ Y) T5 S; Z9 h: L
cmp al,80 0 M, K- b3 l& L" U
jbe xxxxxxxx
8 L5 \+ d) j5 P. z; E0 Ccmp al,09F " z x9 t8 G/ O! [! D
jb xxxxxxxx & w( c; F+ m+ S4 m t
cmp al,0E0
+ z/ _5 P' V) gjb xxxxxxxx
" V& A1 I5 S+ ~! K$ G1 v. _( q5 ycmp al,0FC
" w1 @$ e" U- p- O: {ja xxxxxxxx
/ N! c) P! C8 C+ S8 B8 K" p4 B+ s. \
即看字符是否在80-9F(前两位)和e0-fc(后两位)之间 ; G% S: i( M7 a1 f: S- g
===================================
4 |3 N1 W6 Q. \3 q F3 R) }: a如何具体查找程序的字符集边界呢?常用的方法是下断,用OllyDbg载入游戏主程序运行,一步一步断下去,在出现一堆“□”的时候停住,然后转到ASM模式查看停在哪里。 4 o$ M5 b1 j( \0 e. [" }
L0043BA00: ; w! }! v; U+ {3 `# _6 g( P( T+ V
cmp al,80h ( p% K8 v8 X% s6 Q$ c1 A
jc L0043BA08 + o' e, _9 O4 _' k0 Y- D
cmp al,9Fh
$ N: a- r! x+ A, X: ]jbe L0043BA10 , i G) o. G, q+ p$ e) b
L0043BA08:
4 B x! ^: d0 F4 o* N$ Q8 p) dcmp al,E0h
; l( T$ @) S0 I# O9 A, I; Ijc L0043BA30 ) `& _0 t, Q# w5 D9 V. }2 l6 b
cmp al,FFh
5 p4 W# `5 w2 @1 F A6 fja L0043BA30 1 ^6 }$ v, \$ i/ M0 S
花瓣的上边界为80~FF,而下边界为E0~FF,好,开始动手 $ S: j6 g6 X2 {' M! T
这里我们将上边界改为80~FF,而下边界范围足够宽广,就不用改了。
. _) K! {: E0 T5 ~3 l9 X1 L这里为什么使用80~FF而不改为20~FF呢?因为我们需要让游戏文本中原本的日语空格(8140)不显示为乱码,于是8140刚好在边界外,就不会被送去CreateFontA进行显示,就会显示为日语的缺字码,一个空白——而它刚好就是空白,在显示上两者没有任何区别。
, d7 J. a/ W4 }0 Y, Y( J如法炮制,打开EU修改之,保存测试,OK,正常显示了) j* T, T' X ?- y5 i2 }
6 D! r9 `: P6 u U/ |7 k' D1 l& H原文
0 E' @. Y" n: X6 p. s: Q Qhttp://blog.potatoneko.cn/ |