============================================================
* T) D: P c' S% S《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
! H- ]8 u* @& F. h% |0 @. W6 e" W3 x, m) O4 t) C l- v" u
开发者:肖允锋 E-Mail: [email protected], |! n& T! b. Z1 ^" p
============================================================2 r& s' E" ~- U, Y/ V
6 c* M$ y7 U( U# e6 U1 }2 c+ G, F$ C" l
>> 概述' Q) t7 F; C& J4 P8 N0 q! \; i5 ]0 P; C
2 s/ x+ E& a- r& \
《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 , G+ A F4 Q4 y0 r# O
, z8 F2 g6 H) T6 o0 x9 H3 V5 F4 b 另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
) P% B+ J1 E0 e; ^# d9 g; Q0 l4 ]/ |/ L$ h5 Z5 r) B. y5 Y
+ }1 h9 K1 o, v3 }, U( `+ C: b/ k% B
>> 现有功能
0 u N1 y; u. {% z) ^( y
0 c7 m7 p% ~0 T: I 文本分析和编辑,字符串的编码和解码;
* ^4 L: K0 A/ h. ?3 J; y 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码; / j+ {6 C) |4 e
编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; $ o* v% x; k8 n8 Z/ ~
支持多国文字字符的显示和编辑; 2 G m( u4 G+ M+ M4 |9 ^* i
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; & p. e( `/ M' B
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码;
( G, f/ K0 y/ y0 F, m6 C' f1 @ }5 H% C
. R" A; ?; y1 E& d: q7 p4 P
& z3 |& |$ d& e. L5 f& z
>> 编码说明:
7 p# y2 F% r" J& R8 A# \2 m# I- S. N& _: {3 J; E' X4 T
无对应编码的,按原字符输出; 4 G- O& [3 o' ?! C+ R) c5 p" G
" "(空格,半角)是对计算所得的编码的分隔; $ g/ Q1 F9 H/ ^+ f5 m
":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
: v) w H7 ]3 w8 H6 [- ` 输出 UTF-7 编码时按字节分割,使用空格分隔;
2 @& h4 y) j7 J. \ 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
, f& ^. s1 @, U5 G' b/ V$ W
8 c0 d4 N* N' r7 b$ v
; A% E) t. }0 ~, n% v' K
: g/ s6 R: M' ?! l: l8 z! w>> 解码说明:
. m3 K! R4 {9 J! D6 p5 y* y) A+ w) x% k& L
支持高低字节分隔符(可用任意的符号); 3 m5 I6 I9 C9 F! d) e
忽略编码文本中的空格(半角)、跳格、换行符和回车符; 3 Z9 @. t6 ? u* I5 f8 O8 s
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D; * K- m5 q6 ^' _5 m/ k8 R' Q4 k# k5 f
解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
/ c* j8 H" g* l9 m( ]+ u- {3 R8 E
* Y1 u7 D6 b" B9 |
! A0 \" `3 ^, ]! o
>> 进制说明:" O4 S3 Z; f' i, j! t5 m
y# R* Q' d1 O# k$ z2 P6 ^# [ } 十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。 $ Y- g: f& t( k: `# [
八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |