============================================================& X6 W, b9 i5 A0 n* N
《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
3 W; d7 d% ]5 U! n- p! z7 r0 {! g
开发者:肖允锋 E-Mail: [email protected]
; ^3 l& C7 d( H% i============================================================0 `% `7 w( Y* ]: d# t; T& o4 X
; O4 j* x3 v- A! D: ~% D+ S, F# X7 W
>> 概述
4 a* }* j# n! j$ e
7 P- r& X, C# g- a7 l* Y 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 2 W2 v6 u( N4 d8 C$ G0 H# o: g1 t
7 X* F# }2 d: s" G7 \1 ?3 Z 另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。2 J7 H+ e& C2 l4 w
" S5 K2 p9 F$ \$ {/ ]/ [0 M; b% m1 k) J5 |8 o: `
+ h1 v5 l9 B9 f! l' F6 ^3 i>> 现有功能$ Y. h: u1 o% D& [6 X! F6 `
3 ?5 y! E, \7 W1 Y
文本分析和编辑,字符串的编码和解码;
1 K& U' Q) V9 k9 n 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
' H4 i1 C$ w# c# R T 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法;
0 w! W6 r$ c. q: I 支持多国文字字符的显示和编辑;
- L/ w9 b5 Q2 E. j% L, l+ o$ m# O 支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作;
1 m) u; B5 i. _1 d( S 可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; & J( B% m. n/ n
( _# _2 j8 c+ E5 [/ c, v6 e7 a) o' J/ i& _! c) i
1 a" T& J6 C. ~: H; A8 d
>> 编码说明:
4 ]- ?+ @6 G/ S; M# Y, h7 O4 a
1 R( B: i, y& O7 `' E" z2 z 无对应编码的,按原字符输出; ; |7 J5 B, Z: }/ h1 Y! I- n3 O, @
" "(空格,半角)是对计算所得的编码的分隔;
& {: t' d8 x. [) w- ?) D" z ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
# E+ c {# f7 Y' @1 o" q, G& w 输出 UTF-7 编码时按字节分割,使用空格分隔;
; B* G8 ` _9 `" d; G7 n8 x) ` 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
7 X. y3 m' J8 R, f6 |9 }# A1 D8 W5 e" }8 q
1 V. j- e0 u" Y' x6 \5 F
1 a- }# f; L+ r( h) j6 o0 k( h>> 解码说明:+ A# J% m+ `7 |* m1 Y
" f3 L) ?) U! n
支持高低字节分隔符(可用任意的符号); 4 G( A" x# [9 ~ |7 ]6 O
忽略编码文本中的空格(半角)、跳格、换行符和回车符; " T% _/ v: ?7 [8 X
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
% J! @& u9 m, ? 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;2 k8 `& g8 T1 ~3 Z: l8 e. S" Y
* x/ i: U& i$ y' k% {6 _
) \# @0 G7 p2 l- K2 B: n
! a* R: i# S# O, G4 q: H7 q
>> 进制说明:$ Z9 k# Y: A8 Z+ P" a
8 X$ |9 X. f- R
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
- J. {& v3 s ^3 f 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |