冒险解谜游戏中文网 ChinaAVG

标题: API Hook的几种实现 [打印本页]

作者: shane007    时间: 2009-11-24 17:51
标题: API Hook的几种实现
原文; i8 Y0 S" ^9 P: W3 ^7 G- o+ [
http://www.cnblogs.com/rogeryu/archive/2009/06/04/1496538.html
9 b0 y2 k3 o8 y* C- `' f4 B9 L& L  i; n& i. C
所谓的API Hook,就是利用某种技术将API的调用转为我们自己定义的函数的调用。这种技术在实际项目里面的应用也是很广泛的。最近,我在做关于我们项目的自动化测试的时候,就遇到了这种情况。在写测试代码之前,我们对测试代码有一些要求。1. 不能因为测试代码而修改原代码。2. 原有的模块是以dll格式输出的,在做测试的时候,要测的类和函数也只能使用dll的导出类或者函数,而不能将源文件重新编译。由于这些限制,导致测试用例往往不能在普通的机器上运行。比如这样一个函数:% y" u" [8 A  E- ^

7 A/ L9 x, d' e# T9 Pint func()
  U; U: a4 C. Q% ~{% K* X  V! ~* @. q  `- [
    //Some initializing codes3 V) ?4 N0 N+ a6 v8 P9 q) X5 n, N
    int hardware_code = get_hardware_code();7 H" V% p1 d! p/ y& R7 f
    if (is_valid_code(hardware_code))3 r, V" u8 K- b# x4 u
    {4 T4 H% V) t: l* w
        //
( q6 ], n/ Z& @9 d0 _    }
! c) G8 v- z: b8 d& g; Y+ ?    //
2 p& U- D. Q! J: @7 w/ D% h    return ret;
. P* ?* c- B$ r: p9 l( _}
, o3 u/ n! |: |* Y( ~* r8 x此处,函数get_hardware_code()是与特定平台相关的,在普通PC上运行肯定无法获得正确的结果。如果拿不到正确的结果,也就不能对函数func()进行测试了。于是,我们就可以利用API Hook技术,在测试代码里面,把所有对get_hardware_code()的调用换成我们自定义的函数mock_get_hardware_code()的调用,这样,在我们自己定义的函数里面,可以返回一个有效的代码以保证原代码能够正确的往下执行。8 ~* g9 y1 y1 Q* `- a5 X3 t9 r
: U9 _9 v/ O% v, o9 O
经过研究,API Hook有这么几种方法。
) K* X. ~7 s+ @- P/ U8 r/ w* p
" b$ i( g- T) S' R: h2 m1 B0 o1. 改写函数的首地址。
1 V' b9 ?' L( B& h' _
. _8 b+ k. p- q8 l0 L这个是在《Windows核心编程》里面大师提到的API Hook的方法之一。原理就是,首先获得要被Hook的函数的地址(比如get_hardware_code()),然后将其首地址之后的若干字节(通常是5个字节)改成一条jmp指令,而jmp的目标地址就是自定义函数的地址(此处为mock_get_hardware_code())。这样,当函数每次执行目标函数的时候,就会跳转到我们自定义的函数里面去。这种方法很简洁,据说在Win16的年代经常被使用。但是大师并不推荐,好像是因为这种方法在多线程的环境下会有什么问题(具体的我忘记了,大家可以翻书看看)。
( T' v! j5 z: V- x$ ]: c: U
) N! P+ c7 Y% l/ O: z. G这样的话,只要我们能得到被调函数的地址,我们就可以随心所欲的修改。当然,由于大师的不推荐,我这种方法只是实现了一下,并未真正应用。2 `9 L( p, ?+ a( W
: S  \. p$ N' r% n, n0 P
2. 改写导入表4 M$ k2 _! F9 T$ G

  D* {5 R# |5 O5 C这个也是《Windows核心编程》里面提到的,也是大师所推荐的。具体来说,就是遍历当前进程里面的所有模块,对其中每一个模块查找它的导入表。如果找到被测函数所在的dll,并且发现这个函数,那么就把这个地址修改成自定义函数的地址。关于如何从导入表中发现被测函数,我也总结了两种方式。1)对于一般的C导出函数,可以直接通过比较地址的方式去找,这个也在核心编程上面有一个小例子。2)对于C++中的导出的类成员函数而言,由于C++的指向成员函数的指针和普通的指针有所差别(我没仔细研究过,从网上查的),在将一个成员函数指针转化成普通的函数指针的时候编译通不过,因此我采取了第二种查找方式,也就是查找函数名。这还有一个问题,由于C++的导出成员函数名都进行了修饰,类似于?MethodName@ClassName@...@Z这种怪异的名字,不过,只要知道类名和方法名,然后查找MethodName@ClassName字符串就行。如果找到了这样的函数,然后在修改它的地址就行了。
' \1 Y1 z* [+ K2 w7 ^: P/ |
, }+ x) g& E5 f+ k$ |; t另,关于导入表,大家可以去看雪论坛上有关Windows PE文件格式的介绍。此处就不多说了。. {/ E3 o* J9 q1 n: y; h% {

6 \1 \  z: O' X3 E# R: r# M$ B# ]3. 改写虚函数表。
' ]7 r% ]. J. R( S
& u# Z: N1 x' {! A. K2 `本来以为通过方法2就能hook住所有的导出类成员函数和普通函数,但还是出现了一个问题,因为我在尝试hook一个成员函数的时候,发现这个函数根本没有在导入表里面。后通过反汇编发现,由于那个导出类成员函数是一个虚函数,因为在通过指针调用的时候,它实际上是从虚函数表里面获得的函数地址进行调用的。因此对于hook这类函数,就需要改写它的虚函数表了。关于这个需要对C++的内存布局有所了解。我在这里就说一种比较简单的方式吧。: o" {- Q- g: l# F3 `7 i7 Y

5 Z' g, H1 G) h& g一般来说,对于某个含有虚函数表的C++类,this指针指向的地址,取值就是虚函数表指针。虚函数表指针指向了虚函数表,里面的每一个元素都指向了实际要调用的函数的地址。因此,可以按照这样的方式访问虚函数表指针:1 }$ t, ?1 z, K

# b, L: ^, u: h* d) V, ^1 E. S; xint** pVTable = (int**)this;
/ j# h" K! g5 j( N% D
. ~) G9 j% G. U4 N7 }! @也就是将指向对象的指针强制转化成指针的指针,这样就可以通过取值就可以访问虚函数表:
0 U, [0 j! K0 _2 H: ]& o3 j
" X7 g1 C0 w5 [6 C(*pVTable)[0] = address of virtual function 1;
9 i# t! P% |! Q
3 z# B7 J* S2 G. X# G(*pVTable)[1] = address of virtual function 2;
! v: l% P9 Y' b: t9 @
7 j  z3 D( O7 C# H...
0 y, O4 M" j9 t# K; ?
4 v' k# |0 Q1 p$ J4 `9 B. r2 z6 Z因此,我们就可以改写虚函数的地址了,从而达到hook的目的。这种技术来源于网上。当然,我对C++的内存布局也不是十分的清楚,如果一个类进行了多重继承,它的虚函数表是什么样子我也不太明白,这里只是说明了这样一种技术。6 K0 x" O  S$ j( t5 w( j. |( j2 A2 _$ s

: v! V/ t  A  ^以上就是目前为止我应用到的三种API Hook的技术,其实实际应用到的也就是后两种,这两种技术能够满足我目前项目的需要了。如果还有其他关于API Hook技术的话大家也可以交流。% H0 `! a- y( r* o+ Q& [, b% b5 r
7 c- _) w0 [, v* X! _: c, N
另外需要说明的一点是,上述三种方法中不管哪一种在改写地址的时候,由于Windows一般将那个地址所在的页面设置了保护属性,因为你需要用VirtualProtect函数将页面改为可读可写的属性才能改写,否则会有异常的。




欢迎光临 冒险解谜游戏中文网 ChinaAVG (https://chinaavg.com/) Powered by Discuz! X3.2