============================================================
3 t1 ^5 D# V2 D% V! G5 }0 Z3 G《字符编解码分析》 StrParser 1.2 —— Developed By RainVan, C/ v F( v3 p0 }
. ]" [' u$ P/ t5 V: j7 N' \6 W7 _
开发者:肖允锋 E-Mail: [email protected]
/ S/ C/ m4 O$ o============================================================5 C1 K" O8 |! V; ^. j" ~
' v) Z" ?" F; @$ ?# ~: c& i
$ A. y6 v& T6 a) V& S- y. @>> 概述
- F8 x% M1 S$ S- F
, D( J" Z0 u& m& `) T* C 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 z$ h5 T- T* d
4 k7 a5 i# P; ?: ?+ m0 z+ G
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。2 I' `5 V" ^: u& o7 C! X- F# g/ U
2 h8 O5 `! n1 m2 d
4 S# R A C9 T: q- F) h2 ]0 ]7 V: c4 z& ]- y% H& E) ~
>> 现有功能0 l% p- p5 j0 d! |, M7 I/ k& I
. M9 z5 C; p6 p$ e2 W+ p. X
文本分析和编辑,字符串的编码和解码;
2 C* x* [& ~! J( j3 W; f9 R6 \ 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码; / L' n- a4 Q) n- ~* Y2 O- h1 C7 t: D$ W
编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; ) b5 I4 g+ Z. F- Y1 j1 U" g
支持多国文字字符的显示和编辑;
; f! Q" t _2 j# J 支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作;
6 h6 f. Q X, @1 T" S' q 可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; 4 t% D9 m, l7 \' n; W
& K9 _% s. C0 y+ Q C3 z
) X' C+ O/ n8 z. \7 a
0 d1 K' n. W$ V8 }>> 编码说明:5 n: {- x& q- e6 j+ I; ^
% q* a# w* ] b& e5 t4 A W2 {6 D 无对应编码的,按原字符输出; , z; P7 U$ z. Y" u a9 E! U
" "(空格,半角)是对计算所得的编码的分隔; [3 K6 O1 R; G4 \2 V* y! Y
":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
: Y; u( O6 M P+ U% y1 U6 [ 输出 UTF-7 编码时按字节分割,使用空格分隔;
6 ?& b8 @. k4 }, R# b! W5 K 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
. u* r+ F! E, a& J
. @; Y0 ?% j& I" G* F. [9 x: }$ O p
) b4 q! |$ r7 k+ _9 [* |% m
>> 解码说明:/ T2 V4 \. `* l5 z" \
' p$ l/ e+ ~7 K; U' f+ [ 支持高低字节分隔符(可用任意的符号); $ F5 n) ?0 [. P! e3 x/ m
忽略编码文本中的空格(半角)、跳格、换行符和回车符; % W$ p o. p8 R4 g# V8 x
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D; 7 S+ e# L1 ^6 _) k* [" l
解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;5 z+ [2 Q0 L5 N) x
& p' C& K3 r, I, I) b1 h/ t9 N( H0 L: D4 A$ Y
1 `/ i+ _0 h+ Q6 `% F2 l. E
>> 进制说明:
0 M& e% {: U; J$ S) b/ j* B8 W" Q* T5 g8 \3 p9 z; P
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。 % ~( p g' H: u% V5 d
八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |