============================================================% D1 l% G. L; N m" w2 ?: a9 n2 s
《字符编解码分析》 StrParser 1.2 —— Developed By RainVan6 X, Y; C% C' o3 ^1 A; P
/ v5 I7 {) H# B5 E5 E 开发者:肖允锋 E-Mail: [email protected]3 C/ k" r" x, s( h
============================================================% Q% s: v+ s3 _. a- p6 i
# m2 y6 ?5 G( M# Q- i' W5 J6 M. T: M8 o: ^2 t
>> 概述
: J$ C- U* l# N/ s3 G
2 p2 n+ b, d7 m0 A% Q4 P 《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 1 w, h( p! m$ P" d) a8 Y7 A: S
: k0 k3 o# W- K/ K* v7 u0 B$ w6 [
另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
4 [, m2 b8 P/ e* [) m& C6 S3 v: w) a) A
% n# j+ @7 `$ R; G" Y' X- S" i" t2 [9 ?1 j, h7 p
>> 现有功能
% [' _0 X& X! Q4 i
. k& W" B6 H+ T) U; ` 文本分析和编辑,字符串的编码和解码;
9 g6 _" M& n4 D3 \ 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码; 2 h) F6 u$ D; Y6 ^0 a9 c
编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; ) P' @2 u% t, L8 V
支持多国文字字符的显示和编辑;
+ V; j& D1 g+ ~: U; y 支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作; 5 v( D# O6 A, X5 Z1 T# E9 k
可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; ! U2 M- T& n4 U" g; r T
& h1 t' Q' |4 l% |/ C9 Z3 t" A( ^; i2 x L7 {5 q
/ x$ q4 d. i0 b) X>> 编码说明:. b/ i; B+ s/ {4 k [
/ K) k z0 ] h$ h% H( ]3 {
无对应编码的,按原字符输出;
; ]. e2 c+ O4 d+ s4 |/ _ " "(空格,半角)是对计算所得的编码的分隔;
$ O: B0 [/ G9 W4 x3 K. m | ":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用; . {6 V4 v. }. O7 N u- C2 S2 {7 m
输出 UTF-7 编码时按字节分割,使用空格分隔;
( n0 S7 U N/ s9 W* C 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
8 B- d0 i% Z7 O: `0 y' D* T& h' ^. M0 T U4 ]$ Y' H
. t- x9 m7 D) |1 y
+ c7 m( L2 ~+ Z% Y
>> 解码说明:. m1 U0 P. T* a' P
( _" ]+ T" Z/ |. H; L$ w$ G- ?
支持高低字节分隔符(可用任意的符号); ! y" K, l& T" o
忽略编码文本中的空格(半角)、跳格、换行符和回车符;
0 c* ?' }8 g8 Z- E 十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D; ) x* R0 O& Y" r) e8 y; f
解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
* S: j v9 ^( Z' q% \
9 } P% K2 I. ]. Q2 D( O3 F* C2 E# }2 s
6 T( b" y' H7 V1 I5 g% f>> 进制说明:' q6 Q' H2 x# C. q1 W
1 z# V) p/ p5 P) b$ b4 c! | 十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
; ~4 y0 A6 m' B+ @6 P 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |