============================================================
; ]" [; p+ |" e0 x8 T《字符编解码分析》 StrParser 1.2 —— Developed By RainVan
% O0 ^3 L8 T: U2 Z9 p; G, e$ [/ _; ?3 k: E7 }: }
开发者:肖允锋 E-Mail: [email protected]
) T: k8 x" J# H5 N) ^============================================================: @ s# S% z& t8 \; \
& D _: w3 Q, D1 ]9 b
5 `1 B2 B4 V3 t5 A. c! E' ^/ y
>> 概述
! {4 b) P$ }1 ?# b3 z/ E
5 C; f- h( C! j- z4 l 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。
" ]( Q1 F' c; m$ q
( ^. l! O3 U, P% g! w 另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
' _6 O% I0 Y& q- z T% e% g& h3 N; W# I7 {6 [: ]
; Z( `% t% {$ l# v/ F
" {( f% c! s; j4 y. o/ c>> 现有功能
, L0 m; E" ^. g. z% u
. D! L1 T2 E7 s7 v% J1 S 文本分析和编辑,字符串的编码和解码; - K, K2 @$ k/ K; d" x
编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码;
8 Z5 A' d( x1 ~' ]$ a2 L# c 编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法;
J0 I9 | m. T5 K& s1 f" Q+ j& d 支持多国文字字符的显示和编辑; 3 @7 p+ F( Y+ X0 Y+ M p/ i
支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; 8 u0 ?- M% v7 O! ]# R- Z
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; # g9 c5 F/ n; l
% V3 x6 M+ V( e2 { T0 X7 ]6 z g
}: \5 n8 K- ~) k# E* T>> 编码说明:* t/ J4 t# v2 \% y' B9 L
4 V; a+ ]' Q+ B# d$ Y# I 无对应编码的,按原字符输出; 6 j3 S% A( m a* W
" "(空格,半角)是对计算所得的编码的分隔;
6 {5 R1 u, v4 v, Z# I ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用; ! D, B' J' M% [9 R4 T
输出 UTF-7 编码时按字节分割,使用空格分隔;
% v+ |4 T, W; t, g 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同; , |: N: C+ N* _
/ X5 r& F: A6 f+ j2 r1 g6 a' \% @+ N+ q0 O1 z% q
3 _) T7 g# R( w7 `) d>> 解码说明:
. F8 K4 [$ Z; I$ p$ `. p4 J2 d) u) p0 _) r$ ^% O b# M' q
支持高低字节分隔符(可用任意的符号);
/ `' y2 _( m* C7 y, \; k6 D' r 忽略编码文本中的空格(半角)、跳格、换行符和回车符; 6 R3 ~. c% b3 E
十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D;
& F% G$ K: K9 c2 I 解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
+ s$ W) N$ X5 M( ~4 H2 J% s L
- ?: m( y7 J4 j# R/ [ D, Y3 Q7 u! T' |) u
7 |( p- R6 Q" c4 e" u J2 w>> 进制说明:
5 h0 I2 E- d, g1 f& S. m' q; P, ?# Z6 B/ _( E
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
6 Y7 w/ L" o0 { x 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |