下面说一下基于图像识别汉化方法的大致步骤 / b& [) [! ]( Z1 ] U6 ~
3 @$ f- c! N* K( r
1. 提取画面指纹特征数据
9 f/ [5 ?: G! _( N% W- n我们要对画面进行图像识别,首先要对画面的种类进行一个大致的判断。
. R- [+ O4 M7 g) r1 _. T1 a4 {0 ^比如这个画面是主菜单画面还是对话选择画面还是对话显示画面等等。
0 h, d0 r: G. I/ Y) \' [6 l如何实现呢?我们可以通过比对画面指纹特征数据来实现。
y2 \- P; j h+ C- f所谓画面指纹特征数据,就是在画面中提取一小块特殊的图像块,这个图像块在别的画面里是不可能有的,如果画面中出现了这图像块的话,我们就可以认为当前的画面是某一类画面,接下去可以进行进一步的比较和判断。
1 @; r Z" r# H6 J2 J& H5 q) z9 E0 |7 z$ W' C" b- b2 a
作为画面指纹特征数据的图像块如何提取呢? ; M# {. F9 _7 x# X. s* a
这个我想不是太难,首先在画面上寻找一个具有特色的在别的画面里是不可能有的小区域,用抓图软件抓取为bmp格式就行了,为了比对的方便,可能要进行某种方式的格式转换,比如转换为dds,raw格式等,具体如何可以在编码阶段再决定。注意,这个图像块不能太大,而且要具有唯一性。
+ s1 Q) A- j) o; I1 I
8 W! @% V6 W2 p2. 寻找用来表示字幕ID的最佳字符 ( R! A& Z. k" U& \0 v
这个标题估计就会有人看不懂。 / g! q. F8 j" |$ n+ c% s, o
我们用图像识别来判断当前画面上显示的字幕是什么,当然希望用来识别的字幕的样子尽量简单,否则用程序很难识别。但是,有的游戏的图片字库是加密的,字体的样子是无法改变的,或许还是不等宽字体,任意2个字符在显示的时候的间距都不太一样。
0 x. Q: R1 V" t; `0 i% ^) M: q$ y
这一个有一个的难题摆在我们面前,到底有没有办法解决呢。 6 V3 d% Q8 n y. r. S/ o
我想是有的,对,我想到了条形码。我们可以让游戏的字幕用类似条形码的方式显示出来,这样应该就比较容易判断了。有的朋友可能又要糊涂了,游戏的字幕如何转化为条形码呢? 3 [ D- l7 i# ^, k+ `/ t: W! l
2 t' Q( I4 S: Z' _5 z; P( \
其实稍微动动脑子就很容易找到答案。条形码是什么?不就是竖条和空格组成的码吗?在图片字库里面虽然没有竖条,但是有很多形状类似的字符啊。比如T , L ,I 等等,我们都可以拿来用,空格就不用说了,字库里肯定有。 $ L) i$ v5 \, S% b3 m# I8 @4 _" s. R
+ H* q' o( c1 z9 Y: l+ L1 M
聪明的朋友应该已经明白一大半了。。。
2 D# H- H+ ?* |$ \" s4 F" _- N- @" f8 j p% d! p4 K
待续 |