============================================================) s* H' e5 x# E$ c
《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
5 N1 f$ i' P- _% C) y4 @- s: u; Z3 b1 x2 }
开发者:肖允锋 E-Mail: [email protected]" W" b, w4 |2 m( M" X8 R1 L. H U
============================================================2 h i% x0 d7 b. c5 A- [' x. i
0 }$ @: g5 \ f) \# C7 ^+ f
% \* b* g) ?. `6 Y( d+ B$ Y
>> 概述& X% `! N# F% I5 e, e: m4 C
# S E8 Y4 q( ]7 v2 j 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 / S0 Q1 Q: p) ~" b/ [& ]1 @! N* G, ]% P
5 [# x; t4 u: p
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
/ }. y' j8 [! P* W5 `# [9 f( A- R. r+ C4 E2 }# J7 ?) V ^3 P
$ Y0 d$ N' O) Q3 v0 ]
( Y. N$ i) [" [: ]>> 现有功能
$ K) i# C5 Q; m! t- _) F i. v' ?4 B- e0 I$ F
文本分析和编辑,字符串的编码和解码; ! T1 _1 n! N7 B6 D! f
编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码; 3 U8 z5 |* K0 n! d& x' `! P
编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法;
+ N1 m( d" G& c/ X* m7 f2 f% I 支持多国文字字符的显示和编辑; " u8 m/ a: [: H& C5 j4 n7 a) _
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; + c. z& L$ M" x5 V" P' J
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码;
2 R9 Q% u0 ]. w. K" b/ S0 t7 c: S0 G6 |- {& F8 | \, W+ A6 V
4 `) Y8 x; S+ E) q0 m3 l4 N
P) V- p$ S0 w' i/ j: |% `>> 编码说明:
' S: F; v$ o& C+ |4 o z: r0 S2 }
无对应编码的,按原字符输出; : o2 K `6 T' {- y: Z( l4 F
" "(空格,半角)是对计算所得的编码的分隔; $ `* x/ Z! d5 w, f
":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用; $ b% R4 q6 R1 y$ c& G8 x
输出 UTF-7 编码时按字节分割,使用空格分隔;
/ a( Z, y4 R D1 F 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同; & \0 V1 H/ y) i! l8 M! h5 U
. o; ` b* F0 ?$ z6 b4 ]; |( B& J
[( R* x, S9 ?5 x% E1 E& V
2 T1 j8 ?+ Z4 P>> 解码说明:
, N% u" \+ U6 S7 N: @% T T5 ~$ u# r9 Y4 l2 L
支持高低字节分隔符(可用任意的符号); - B$ Y) F1 A/ `4 m `; c M
忽略编码文本中的空格(半角)、跳格、换行符和回车符; % D% c5 g! Y6 Z# o
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
7 D- i4 `7 v: ?0 j 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
& h8 P/ B/ V, A, j" Y
: I0 |0 p; {! j, n, C/ `; \) N
+ \) x3 Q6 g5 |5 X% A2 ^
. D0 l4 g: ?, x0 O: R>> 进制说明:6 H A8 X! D$ C0 l( V
! f7 |) K$ r9 i 十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。 2 u5 k1 S$ Q! l8 D' B) s$ E$ c
八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |