============================================================9 G8 B$ Y- \$ y
《字符编解码分析》 StrParser 1.2 —— Developed By RainVan7 \6 a" l3 `0 E4 D1 v. r5 b7 q
* o+ q/ P+ }4 v) @' R$ q9 K6 ~ t 开发者:肖允锋 E-Mail: [email protected]
5 a6 k$ Z! H' p O9 Y7 P' B============================================================
8 d7 n& b, _" Z: o: N7 @1 v! Q7 p, u
5 _6 N6 L) N' m* T
+ ^" L: y, f; w" z>> 概述
. G+ \% c8 Q1 s) n8 y4 P" I" ~ t
' F7 ^/ ~( Y7 e 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。
. a; i4 \ V9 o9 Q( D3 w! o& j# W$ X* a- `7 j+ Y: t" ]
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
' [0 n- G# {" Z; a3 S3 D. T
& T, M! t% ~ U* s2 f$ a% h2 D7 P3 F* @
. c1 a0 |7 }9 R, _" D) l; A7 b
>> 现有功能
7 L- b: Z- h/ [% F% Q8 v, L: O
/ Q) I$ Y+ l# C4 w% f 文本分析和编辑,字符串的编码和解码; 6 _% ]$ p* c9 t1 ]3 h8 W
编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
" b2 P M6 l9 R( v% m$ A. b& W( D 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法;
5 f' W' T- @2 E# U* q 支持多国文字字符的显示和编辑;
5 o2 N0 M+ |* N 支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作;
; E8 ~8 ]) n+ [$ F4 T0 f 可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; $ Q8 k0 z/ C+ l; }9 K5 W
9 ?% y' d/ t. ~( ]& T
+ Y9 z7 D# W4 p* v9 m
5 b! F! W' G5 D>> 编码说明:
# S: B! e; y# n# {
9 W3 ~2 B& M) b) K- u 无对应编码的,按原字符输出; E' T- H- P& Z9 i$ e9 W! T
" "(空格,半角)是对计算所得的编码的分隔;
2 q+ ]! w+ R) w) h# g) ]5 Z ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
1 o/ z1 Q1 W2 Q 输出 UTF-7 编码时按字节分割,使用空格分隔; k4 @! x8 s) ]. w7 `4 O
计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
; h8 J( L3 x0 g1 e2 \! ?, d( n+ q/ m; A
- K$ I1 p7 q. j* ^. p
7 }" R9 g9 ^7 F>> 解码说明:+ N+ t% Z+ t8 S# R$ K- |
4 S, p0 A" z5 W) ?' ? 支持高低字节分隔符(可用任意的符号);
8 f" S! {7 ^8 w+ N 忽略编码文本中的空格(半角)、跳格、换行符和回车符; $ r2 P5 C0 H, C" ^' y6 Z
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D; 4 g( [( @- X1 L6 B) T" p
解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;5 {* n6 P5 a1 Q* v. {
4 i% |9 {) c" W8 ]7 E
5 [# s% S2 C, A7 i
6 j4 y& E( Z( ]# u/ W+ J
>> 进制说明:# H8 B: y) M( J0 \ b9 W8 [1 `
2 @: F; E( T/ k1 q; s% s' e- u
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。 # J; B9 \" w* p! H* w+ e5 w5 U
八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |