首先,分析游戏的文字显示方式。玩游戏的时候最怕打开游戏看到一片乱码,现在汉化游戏却是最希望打开游戏看到一片乱码,因为一般在非日文环境下能正常显示日文的游戏都使用的字符集限定,为汉化增加了不少的难度…… 3 q$ o* }/ j: d; \
一起采取Textout方式的年代,日文、繁体中文十个有九个是乱码,于是有了Apploc和NL,后来比尔大叔推出了CreateFontA函数……CreateFontA能够直接定义程序使用和操作系统不同的字符集,于是乱码没有了,而汉化者噩梦开始了,因为汉化后的中文内容在经过日文字符集的编译后变为日语状态下的乱码。
( Z4 u, {0 p: e7 v+ V以下是比尔大叔的MSDN Library对CreateFontA给出的函数原形
' }7 B( U9 \) c, B: s% Z5 Q% d; l; k. ~4 S" W
HFONT CreateFont( ; y5 [% ]/ ` k. \2 V
int nHeight, // height of font - E# G' W% g% b! A8 H
int nWidth, // average character width
0 [* @+ u, ]% J/ B6 R3 O' r5 d# `* Lint nEscapement, // angle of escapement ( N$ |& v. _. W/ o/ d
int nOrientation, // base-line orientation angle
( P4 s! y5 ^& w) Bint fnWeight, // font weight
7 q3 {) j2 A$ C; }DWORD fdwItalic, // italic attribute option
2 w' Z0 {( O# D+ CDWORD fdwUnderline, // underline attribute option # Y' c4 d& o: V' _* I5 T, \9 N+ K9 t
DWORD fdwStrikeOut, // strikeout attribute option ) j7 S% h2 S5 q4 T3 \
DWORD fdwCharSet, // character set identifier 5 z4 u+ f3 @7 k: F
DWORD fdwOutputPrecision, // output precision
7 ?- E4 \# F/ p3 p: A& j" C" A$ O6 yDWORD fdwClipPrecision, // clipping precision
N* w* ?& t% u/ n7 R) vDWORD fdwQuality, // output quality 8 o* |! ~2 | N( L. d; d; ?
DWORD fdwPitchAndFamily, // pitch and family 3 h3 U0 C9 `! a7 f) I4 L' H
LPCTSTR lpszFace // typeface name
3 J& \" T' T& w7 g0 U) c0 B); 1 I* V$ P' ]8 s2 `% T+ Z- t
$ c; B- n/ h- ?4 L
HFONT CreateFontIndirect( , w( ?! {" _, R2 d
CONST LOGFONT* lplf // characteristics
; T( z* s, e! m" f; o+ X. l);
; _. j) m; J9 r0 P! v- u; B其中 LOGFONT的声明如下: 0 e& s+ |8 V, S3 ?; M2 v
& K% O2 N+ b2 X, Ytypedef struct tagLOGFONT {
! ?$ j l/ n, E4 g8 |LONG lfHeight; 3 F9 ]5 ^8 \5 r: m. P
LONG lfWidth; $ R+ k# _% h2 c' k8 `+ a" g! M
LONG lfEscapement;
0 j) O: P4 e4 P1 B% A" E) uLONG lfOrientation;
3 Q2 p$ K/ |/ c& jLONG lfWeight; ; i$ F- n( r5 M5 K$ l+ C/ u
BYTE lfItalic; ! m* U* N5 }3 j& I6 I
BYTE lfUnderline; % S% D4 Z O T: O4 h0 f
BYTE lfStrikeOut; 6 b# t3 O6 X0 @; K# P
BYTE lfCharSet;
' \! m/ h- b: U! ?$ W- ?5 xBYTE lfOutPrecision;
/ ~ u; l+ U7 R4 l7 u7 o& k/ ?BYTE lfClipPrecision;
4 ?5 e! [# X- i0 P9 OBYTE lfQuality; " [" M$ C( }. Z2 P) v
BYTE lfPitchAndFamily;
0 U7 @" ^% k! G, YTCHAR lfFaceName[LF_FACESIZE];
& m( {. c6 E8 d/ {8 A8 F3 b, }8 H} LOGFONT, *PLOGFONT; 4 E0 H, |; t* C k! y$ y* z; i
==================分割线================= 8 u# l: n7 @1 U( x0 R ]+ ]9 b& x
要改变程序支持的字符集,就要改变程序调用上面两个函数时的fdwCharSet或lfCharSet的值 ! K9 @; \* q7 g: c1 G4 m
其中各字符集所对应的值如下:
7 P+ l+ B `& Q) C4 D
( _! ]" K7 @+ P. R) g0 U& {字符集 值(十进制)
7 F- H; ]1 V( |, o* GANSI_CHARSET 0
9 z8 K7 |& [! ]' S/ a* d* `: r! j& ?DEFAULT_CHARSET 1
0 Z5 e% C5 f, e5 \- TSYMBOL_CHARSET 2
$ n$ {7 t( t; |& A5 ?MAC_CHARSET 77 & z, S3 m3 \) P9 [) ~! L4 T: [
SHIFTJI_CHARSET 128 6 C) }' p8 d9 w8 V6 h
HANGEUL_CHARSET 129 8 i* l! Y1 K( ]1 l' W- D9 t
HANGUL_CHARSET 129
# j" q+ ^7 O0 B6 xJOHAB_CHARSET 130 ! _2 {* a: Q* o1 W- k
GB2312_CHARSET 134
7 F% {% L! u' ^1 j+ LCHINESEBIG5_CHARSET 136
! }# M1 Q# [! S s# VGREEK_CHARSET 161 - @' T7 H2 H+ x
TURKISH_CHARSET 162 / U* R% X6 z4 B. L; ?7 J0 A
VIETNAMESE_CHARSET 163 3 M w* t5 L3 e4 u& N# O7 `- |+ A* ]
HEBREW_CHARSET 177 " [3 f' x/ ]+ K' k+ J
ARABIC_CHARSET 178 6 }! L, e# b+ f. z! I7 L( d1 I% z+ q
BALTIC_CHARSET 186
7 F" `1 ]6 j& Y1 ]) `- ?RUSSIAN_CHARSET 204 9 d& M& ~/ L) p
THAI_CHARSET 222 . E; U% X, e L
EASTEUROPE_CHARSET 238 1 @( r9 y2 ^: V$ Y5 u
OEM_CHARSET 255 : O. x9 n5 T& x6 i- ~" B; d7 g- W$ t
可以看到简体中文是86(Hex),日语是80(Hex),繁体中文是88(Hex)
7 L( T1 C# e$ m& ?我们要做的就是找到游戏中定义调用字符集的部位,将80改为86,这样就能让程序正确的显示中文。 - B: c h+ _9 ]6 w0 A! l g
用pexplorer打开HANABIRA.exe,进入反编汇模式,查找Font字符串,我们发现调用CreateFontA函数的位置是唯一的: 0 d; m5 D+ y% Q
于是在以下代码我们停下来 4 r8 L+ ?: }. y6 I
L0041E365: 5 c+ q0 T' A# I4 p) |$ p: d4 o
mov edi,[esp+14h] * r8 ?8 F% {' J
mov ebx,[esp+28h]
( Z+ O- [7 G/ D; n mmov ebp,[esp+24h]
. O; Z4 m$ Q5 l& J2 S9 [$ emov eax,[esp+20h] / ~6 T8 H9 l. ?) t$ U9 j; ?: s. X
mov ecx,[esp+1Ch] & P2 _5 z2 e$ x7 v$ r( a- L$ O
push edi
2 l9 i7 J/ _$ I* c( K$ ^# E7 \mov edx,[esp+30h]
# W+ n) x6 {& `9 @# Lpush 00000031h
) a: t; \4 s1 I; P4 M( m# Bpush 00000002h 1 b6 Y; o7 f7 j! a
push 00000000h 1 _! l( l1 b/ W2 M- p* u
push 00000000h
+ k- l1 c; O Bpush 00000080h ; d; i8 g. y- P O! _' O. f) K
push ebx
9 L# I0 A& l/ }- cpush ebp " B3 ]/ y! S5 V `2 F
push eax
1 q# p; v# u4 Zmov eax,[esp+3Ch]
/ @; e3 }2 l* H: f/ Q) Q/ Hpush ecx
1 l& C# O* E: l& q; l- @. M, |: Mpush 00000000h
) h3 L K% r" \5 y- `( C( epush edx 6 i3 A5 Y4 \! l8 @# f; `+ m, k7 ~
push 00000000h
8 w/ t* C4 E C/ ^push eax / b& n' ~4 X- o8 }% _3 H1 }
call [GDI32.dll!CreateFontA]
0 @! b: w% s5 k elea ecx,[esi+28h] 5 ]8 `" A, |: B" V6 Y/ c' K
mov [esi+00000138h],eax ! n5 ?- e' a1 E r1 [/ B' p
mov eax,edi * ]7 F8 R* h2 X! Q) _) G
sub ecx,edi 9 N x, H/ A: G# U
lea esp,[esp+00h]
5 {* `+ N8 ?, @注意这就是调用GDI32.dll中的CreateFontA函数了,我们在这个堆栈中寻找将80这个值传递给CreateFontA的部位。 . Q# C' k' [' S& A; y- x
push 00000080h
. |$ Y: I" t8 X4 ^) p9 N5 j& D- ~, @就是这里将80值压入传递中
, M5 k4 N0 t0 r5 U H& GPE中标记了这段赋值的Hex数值,用UE打开文件,找到 6 Y" k1 j" ?% B# `, B2 n4 ^
68800005355 % y3 s" O" |- S5 I9 F
将其改为
7 R) @8 T- J7 O. k68860005355 / H( u. I) I8 u$ u5 C! n: R3 L
保存之。 8 g$ w# l1 @* S Z% p
这样PE中看到这段压入就成了
5 e2 W- ^# b3 c7 gpush 00000086h
1 ~- z' I/ K$ J" H, k初战告破,运行游戏,你会看到日文全变成了乱码,说明程序已经在使用中文的字符集了 & F* P# K7 s& i! j' }1 r$ D8 Y3 V
修改游戏脚本,加入几个中文看看…… # Q* O2 {) x! p) \. p
为什么我添加的中文全部是“□”? , Q0 |+ N) W" k
这就是需要解决的第二关卡,字符集边界检查。 . T3 ], d# P% V* T' y
7 w ` W" |( N& S! |
既然已经设定了字符集,为什么还要边界检查呢?这是为了防止当游戏文本中含有某些非法的字符串时产生缓存溢出。于是在字形传递到GDI32.dll描绘字体准备显示在屏幕之前对其进行检查,发现超出了设定的缓存大小就将其拦截下来,于是屏幕上就显示出一个“□”。我们知道,由于日文的字符比中文少得多,所以这个缓存也小的多,换言之就是边界太窄。 2 H" N6 ~5 f; M4 o3 _# i
边界检查的例子: 9 O. F! s' z8 s
cmp al,80 4 e' O$ u" X* ~2 A9 p
jbe xxxxxxxx 4 |$ J8 A; c" w& n5 U M4 y: @
cmp al,09F 5 Y; t t' G# n/ `, K7 N
jb xxxxxxxx 3 Z4 l' }* Y: y
cmp al,0E0
8 L, W H# i3 Yjb xxxxxxxx
D" H1 W# g( D' \, g& E1 e! Ecmp al,0FC f9 G& c& X- F4 b( b4 p: R# ?; p
ja xxxxxxxx / \. K' L" t' x. l2 p
! @0 n7 \; d) \+ s即看字符是否在80-9F(前两位)和e0-fc(后两位)之间
# K/ P) W5 p1 u' v) C6 F) R=================================== 1 t3 p' Y! } b! O! i" l' p( y' n
如何具体查找程序的字符集边界呢?常用的方法是下断,用OllyDbg载入游戏主程序运行,一步一步断下去,在出现一堆“□”的时候停住,然后转到ASM模式查看停在哪里。
8 d) B+ g7 x; W0 h B& iL0043BA00:
4 |: H( V9 i" a# D7 scmp al,80h
) Q% H9 L: J# b: ~7 ?5 vjc L0043BA08 1 q/ l3 v% x4 x
cmp al,9Fh 0 }0 S4 f3 G- \ f% m- k1 s
jbe L0043BA10 . L% U8 Z6 ?3 N
L0043BA08:
+ m( H p+ Z7 jcmp al,E0h
4 R8 o; a& y: A" c( ujc L0043BA30 - h! y$ i& }2 A, c' A
cmp al,FFh
* @! `# |/ L( U' P( Vja L0043BA30
5 R C3 l7 |4 j- A: S花瓣的上边界为80~FF,而下边界为E0~FF,好,开始动手 ! {; U% e/ S) Y# {
这里我们将上边界改为80~FF,而下边界范围足够宽广,就不用改了。 4 w! {" B" ~0 a* }) K
这里为什么使用80~FF而不改为20~FF呢?因为我们需要让游戏文本中原本的日语空格(8140)不显示为乱码,于是8140刚好在边界外,就不会被送去CreateFontA进行显示,就会显示为日语的缺字码,一个空白——而它刚好就是空白,在显示上两者没有任何区别。 & K% ?! o, J9 t' l# Z
如法炮制,打开EU修改之,保存测试,OK,正常显示了
: f3 F0 A3 d1 U9 d# S y- k' R5 t$ w1 |" T3 s% Y- a
原文
1 @; F$ j n @/ F( S' ]& rhttp://blog.potatoneko.cn/ |