============================================================
& t s# v; d7 s% F; X& x; b《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
7 `4 n4 g5 n% A$ T0 W- f
7 r) G$ G" I6 U! I1 f: Y* c 开发者:肖允锋 E-Mail: [email protected]
! b4 R' f6 r: P; V; l============================================================
7 Q/ H3 N% h. I: T' W! z D% G Z$ Q/ F2 O+ p; E
" C$ q m# w5 D! S# S8 n% r>> 概述. W P' E; B+ C
/ b0 {7 _7 v9 Z# n$ ~2 h9 @ 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。
7 ~: V. x# N( V! S! r0 ?0 Y8 g9 q) P7 Q
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。- e$ f% S7 l. ]& o/ Z9 w; ~( n
' l& p, W0 d) Z" m& u
+ c. v' t; [) T5 v9 ?/ w* V' z- f/ E$ Q, q: G
>> 现有功能; }4 V6 g& S4 C; u
, O4 p1 m7 C4 y ?0 N5 U0 [$ Q
文本分析和编辑,字符串的编码和解码; ; W5 D7 P+ L3 @! D# {9 X1 \
编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
9 X X9 F; s7 t5 y; d- g 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; % L5 {% X6 t: O6 P
支持多国文字字符的显示和编辑; 4 |1 B0 s; R6 M1 d% Y6 I( l5 G$ x
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; # w! k2 q- X# ]: {4 r$ W
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码;
9 K( \% h7 J3 z+ U7 \9 `; l N# c0 f" P B) _2 U: P# e, E$ x
+ u, ^+ h7 M' l- J
% `! d& U6 q$ A! x# o>> 编码说明:
3 x3 }7 }" b- m* S- |/ n# c; ]( N: B
: V; b+ O8 I3 w% M+ F+ z3 a* ` 无对应编码的,按原字符输出; 3 P( H% E( w' y- ^/ v! M) P
" "(空格,半角)是对计算所得的编码的分隔;
0 l _( @$ _! D7 \- A ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
3 @( U0 A3 V" \8 X7 @: J3 } 输出 UTF-7 编码时按字节分割,使用空格分隔; t0 M& j/ A7 _) a* E
计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同; ( j' E, b2 U! f
$ z. x# f1 h$ H. [# _& |
( |: k/ ?# _9 I: G) J) E& O" R5 k" c* E8 |% p4 E, T- w
>> 解码说明:- _8 ?) `; T9 o$ V! ~
' T. ~! r0 Y9 p) z 支持高低字节分隔符(可用任意的符号);
6 ]( h2 X$ D3 i/ g$ l+ ]' H/ C; U 忽略编码文本中的空格(半角)、跳格、换行符和回车符; 3 n8 L, F3 q8 K3 I* v) U" e1 g" b7 O7 s
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
$ @+ N" ]# [: J: I p9 o9 t 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;0 r: R5 b# d* r" X m
5 L7 Q- M d; }" B, p& P
! u' }' `5 L1 _7 T
8 A [) J2 G; f/ S>> 进制说明:+ @: | g6 k5 H( y
7 b L( W: n8 Q5 B7 {" G4 f
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
% I* @9 ]. y: @ 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |