============================================================6 Z' V3 K3 z0 V# o! L( L
《字符编解码分析》 StrParser 1.2 —— Developed By RainVan9 r% T, c& K9 t$ ^
0 A' s- P% n! i4 V2 Q9 d+ R' @ 开发者:肖允锋 E-Mail: [email protected]1 i$ P6 {1 A% x- R5 v% r. i ^
============================================================+ o) a$ d R1 N- w+ l" a# P
' F, @9 W. Z- K) q3 s
6 L2 X# h8 a0 \) L>> 概述8 W. s+ o9 S7 H [: R
1 S& m+ S2 X% b, H" y6 z
《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 $ |! \$ a' a" X+ y1 k5 Y
+ ]) I% s" e1 H1 p' B) T4 L
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。6 W2 X2 r$ W& |
* U) [" k3 l, q8 o4 P" D! Z7 x
& a* }4 K7 _, i* y$ C+ a& ~" g/ N2 I
>> 现有功能
( }7 O$ h2 L; V r, H! O6 B
" h9 E- E: ?: P 文本分析和编辑,字符串的编码和解码;
0 ?; B3 z/ @% j& u: Z W/ @# ]- l 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
& k% ?( W2 U3 L) q) I 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; 3 _1 u9 l$ I2 k$ S$ R& Z( g6 ~
支持多国文字字符的显示和编辑; . T4 y0 ~! |% E% r# \% n% B* L+ a" g
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作;
5 R8 U1 C4 I3 d8 B) N 可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; : e- f' H6 k8 ~( f+ Y# K
) G5 d* L4 Z, t
( J: I9 |- v5 f" \6 ~% ~: c: b: F8 \: V4 n0 U | ^
>> 编码说明:* g9 i: I1 p! j; A
, G) s6 d5 N% t% J+ W1 _ 无对应编码的,按原字符输出; 6 c2 y& H& K' s' P# Z2 q* s
" "(空格,半角)是对计算所得的编码的分隔;
1 T4 M* Q+ H9 Y }' Y$ g ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
7 V, B: R3 \. b+ \' u n, R 输出 UTF-7 编码时按字节分割,使用空格分隔;
6 w; h f& `! N 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
2 ] ^+ V8 b2 d/ e Q9 O" D3 x$ G0 u- L8 _5 |
0 m$ p) W, `( H4 z, p9 ]6 H' d' S2 }
>> 解码说明:- C* n( {1 w$ r; ]) Z5 L" U1 I
6 w* W2 C' S2 E* G' l. l* n
支持高低字节分隔符(可用任意的符号);
+ O: v6 u5 @) @4 j) c, O 忽略编码文本中的空格(半角)、跳格、换行符和回车符; 9 Q! ]6 d; m7 [8 O) W; P8 X
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
- O, c8 ]1 c6 G: _0 h0 U 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
( r: |$ G/ r4 B' k8 D2 U& J# \6 r
* H/ u! O* j4 s$ R9 Y1 K( h0 ^
" [% ?9 }& C+ y9 i( X>> 进制说明:
' S$ [4 N) _4 L5 f" t F; f i: Z6 O+ k1 [& `
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
9 _& Q2 [! N8 H! [ 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |