引用第2楼慕容枫叶于2008-10-27 19:33发表的 : % K$ G( Q1 L" b" v' c
…………
) R' r8 {1 _7 S+ g5 l( y/ I0 G字体变小了。。。看不清楚、、、
) k; B% T, g/ B2 n$ a7 h4 M- o$ W. s# Z# Q8 {, J1 t j
如果你能说清楚 / D2 n" O( j- m+ ]7 N5 o
双字节unicode英文文本替换为双字节unicode中文文本 0 H! v. Z6 S4 U! W; m
....... # R& g% I+ m/ s' G) R+ ]) J ]
8 |6 ]3 j. x$ c, b3 m' B' R
f |! \/ W$ a( K/ B7 _- F由于每种语言都制定了自己的字符集,导致最后存在的各种字符集实在太多,在国际交流中要经常转换字符集非常不便。因此,提出了Unicode字符集,它固定使用16 bits(两个字节、一个字)来表示一个字符,共可以表示65536个字符。将世界上几乎所有语言的常用字符收录其中,方便了信息交流。标准的Unicode称为UTF-16。后来为了双字节的Unicode能够在现存的处理单字节的系统上正确传输,出现了UTF-8,使用类似MBCS的方式对Unicode进行编码。
% [1 q, h. e% X5 R* t6 r8 n, k
" [$ N7 C& f) @% P" a$ D" y( L当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。软件有三种途径来决定文本的字符集和编码:
+ s- S0 z# O5 H4 b+ C 最标准的途径是检测文本最开头的几个字节,如下表:; G3 A7 L/ z+ x2 a( V
开头字节 Charset/encoding8 o# t7 [7 Q+ P3 h. c+ A+ r
EF BB BF UTF-8
# X/ W( X. ]. @FE FF UTF-16/UCS-2, little endian& A B# y& s; p7 G W9 e7 n. D8 b
FF FE UTF-16/UCS-2, big endian
8 w& K, A, G8 Y9 _# Y Q1 XFF FE 00 00 UTF-32/UCS-4, little endian.
" U' g" `8 r1 R# Y1 `, J, T4 J! k1 w00 00 FE FF UTF-32/UCS-4, big-endian. . C( d2 [% ~. V- @2 L: L
2 p* N5 A3 [, r- F# l; y D不论是中文还是英文,只要是UTF-16,就一定是2个字节,具体的码表可以查有关资料。" p, l' D( `3 ?- I7 }; c! d$ B2 ?
这个游戏的文本是UTF-16编码,是在头部有FF FE的缘故。3 m4 F2 X2 l" f! D# }
7 i- q6 y" o9 e- [3 w
- V& Z: n t% Y1 t
, X2 D' R; Y1 @/ n+ O4 o/ l1 l: Z {, h; C" v8 B( X
- }6 G3 G4 h9 e) A) m3 m6 `3 f7 o5 _ |