============================================================
* M7 l7 i9 v) ~$ w' u& _: W《字符编解码分析》 StrParser 1.2 —— Developed By RainVan8 w5 s9 n" A' c8 F+ Q
5 t$ ~2 c% s+ b$ T: i5 Z* O 开发者:肖允锋 E-Mail: [email protected]
2 \( S! D# p2 o# C============================================================' e3 {9 u- E' ?$ \- U1 W
! j- g$ l8 N. z1 h" |! [) h3 r+ M: s. s( ]/ H
>> 概述
; K$ v) A8 v3 @2 W6 n8 C/ k/ }3 W% A4 t/ d6 `9 P6 p+ I
《字符编解码分析》是一款字符编码分析软件。支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码格式,可使用十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法。除支持简单的编码查询和换算之外,亦能对文本进行分析,查找和提取文本中可能存在的相应编码的字符。 - V. |- K1 q! m$ `
& C) [5 R7 {7 T m: |3 @% i 另外,软件支持多国文字字符的显示和编辑。可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算相应 ANSI 和 Base64 编码。
$ p$ ~8 d1 M* d' U& r' g h6 i& Y. @/ z! T/ r1 t
, a+ y" R& W2 I: m- l4 b. F6 S7 V5 h5 n5 ]& B$ F$ `
>> 现有功能6 J% D; s' m6 W$ _2 z
]: r* r+ f& p% Z% E; g
文本分析和编辑,字符串的编码和解码;
; N9 J4 y' Z) E+ Z# ` 编解码支持 ANSI、Unicode Little Endian、Unicode Big Endian、UTF-7、UTF-8、GBK(GB13000)、GB2312、BIG-5、区位码、Base64 等编码; 7 D) a9 u" v) w
编解码支持十六进制、十进制(单字节和单字符)、八进制和二进制等表示方法; ; j) I' J% R4 x5 G' V! G
支持多国文字字符的显示和编辑;
2 }" j w3 K. J3 d3 e- E4 Y0 w. N/ X 支持 ANSI、Unicode、Unicode Big Endian 和 UTF-8 编码的文本读取和操作;
( E- i8 g2 W7 x# y& ^* ^0 X; I& F 可选用相应的 CodePage,处理 GBK(GB13000)、BIG-5、Shift-JIC 和 Unified Hangul 等双字节编码的文本,计算 ANSI 和 Base64 编码; 6 l. e7 s1 b& I- e s# ?
1 \+ R' f! \% s; j, E s
: s8 b0 I: b0 i& _* K/ r& |; S9 m' A, {
$ k( |. ?5 T8 Q, Q>> 编码说明:
: T q* i- o& s& Z1 a9 m* S, ?! k
无对应编码的,按原字符输出; $ q) |+ u9 ~+ G$ D! s6 H) X
" "(空格,半角)是对计算所得的编码的分隔; 3 P1 N: {* r; A- P8 }0 A
":"(冒号,半角)是对双字节字符高低字节的分隔,常用格式中不使用;
, L: \+ [, j4 M5 _" w5 O. ^ 输出 UTF-7 编码时按字节分割,使用空格分隔;
, S' g, O3 \& }! f 计算 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同; 5 ~) Y( F% v$ H% S
F" {8 F& [2 e) k3 j1 v6 o d4 j( B
4 D$ ~; b# Q; G1 W4 N>> 解码说明:
6 o; Q2 W- g" ?! b
a$ V" b! n& h* a 支持高低字节分隔符(可用任意的符号); 3 H& ?9 [' _7 T* h
忽略编码文本中的空格(半角)、跳格、换行符和回车符;
% y$ V9 V7 n# e' I" K 十六进制编码的位数为四位,前面不可省略 0。如:000D 不可写成 D; : `2 E8 j9 T# I
解 ANSI 和 Base64 编码时,依据所选的 CodePage 不同而不同;
; N& M2 z0 g* }4 M0 U+ R, z9 @( H$ K2 k
9 O- P1 ^- ^$ T: B
1 B+ R7 d# I. C0 `, ]* }' J>> 进制说明:+ c$ c1 l# p$ V: p) J
, z1 N" s, S- V" D2 ]2 V
十进制分为按字节计算和按字符计算两种。如:“我”的 Unicode BE 编码按字节计算为 098:017,即高低位分别计算。按字符计算为 25105,即将高低位一同计算。
$ d- W) i/ L8 S4 K; k 八进制只按字节计算,不按字符计算。十六进制和二进制两种计算方法的结果则相同。 |