============================================================
9 m5 R; ]8 C" \' D7 a《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
" W( n' G' m+ |8 k6 C4 z
* g4 R1 @3 S2 y' D8 x4 b 开发者:肖允锋 E-Mail: [email protected]
! Y6 Z- |; f; t============================================================! N9 e" P6 M5 R0 |9 d
$ ] Q* D" F; d2 O/ S8 T
; q# n: O* b$ a/ |" T6 E( C x>> 概述
2 V$ d) ?. j1 I/ }( L* r
P8 ?9 B2 k, ?+ j, a 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 0 f3 y1 @; ]+ a9 U+ y4 d
; `, N K6 f" o 另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。. S' Z/ C; q V* c9 h0 v
7 r5 ^, h( z- z; u( w! I% `8 {1 n' |' w" n
. Z" G! N5 }, h x2 m C1 Y>> 现有功能) P4 A( t. x" p0 Q1 a
0 ~! O" s# l' S! \9 ]! l9 |2 g5 x: k
文本分析和编辑,字符串的编码和解码; : ^) m- L! z1 x) a u% p% r: u
编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
1 Y# h4 v; t, U+ ^9 K7 N7 a/ N8 S 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; 8 A! Y* ?. p( {5 `5 ]
支持多国文字字符的显示和编辑; 7 K" s" a/ t1 F$ i
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; " a0 d. R' |% n5 Q
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; 9 H3 z9 w9 W; Q& K* O
7 E( Q% V% t+ Z, j" b; x
- l/ K7 X& w# S: ]# a/ Z5 ]# J5 l* i1 t. }+ H0 q
>> 编码说明:0 v4 E) f+ e! X4 \
3 e9 F# R* t# I- R3 B* r 无对应编码的,按原字符输出; % @8 S( _, F+ w' `/ ]
" "(空格,半角)是对计算所得的编码的分隔;
; w- l$ w! q& {" L0 Q ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用; 9 s1 O% k$ l6 Y
输出 UTF-7 编码时按字节分割,使用空格分隔; : o4 e7 y: m6 D5 o5 d0 X7 ?
计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同; 3 X) \7 [7 a( b @1 C! w
8 h+ y( N1 J4 h3 H* L9 @( y; ]$ K* d- F5 b7 w9 e7 `, z6 `5 h; X
- U' t5 K, |7 Y- `4 S% W
>> 解码说明:$ X8 t0 ` p6 \. K
. E3 p9 T% |1 d1 X 支持高低字节分隔符(可用任意的符号); 4 x0 Z" @; N) {7 L( V- E8 O: S
忽略编码文本中的空格(半角)、跳格、换行符和回车符;
( A; N# t9 Q" ?( v6 G2 T6 ` 十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
- d4 w% C( k5 f U. O' F5 w/ I5 \ 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;( |9 V8 u: c0 u. y
7 L" [: T4 {3 S2 ~
! } V- \) [( a' }8 {: Y, X. j8 ]1 ?. O$ P
>> 进制说明:
/ s, ^" a3 V& ~/ ^. [$ a# B* O/ w3 U$ \6 W* U) }
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
/ u1 {. {$ b# q 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |