堆栈溢出原理 -- C/C++ 点滴积累...-- 编程爱好者博客

堆栈堆栈是一个在计算机科学中经常使用的抽象数据类型。堆栈中的物体具有一个特性: 最后一个放入堆栈中的物体总是被最先拿出来，这个特性通常称为后进先处(LIFO)队列. 堆栈中定义了一些操作. 两个最重要的是PUSH和POP。 PUSH操作在堆栈的顶部加入一个元素。POP操作相反，在堆栈顶部移去一个元素，并将堆栈的大小减一。为什么使用堆栈? 现代计算机被设计成能够理解人们头脑中的高级语言。在使用高级语言构造程序时最重要的技术是过程(procedure)和函数(function)。从这一点来看，一个过程调用可以象跳转(jump)命令那样改变程序的控制流程，但是与跳转不同的是，当工作完成时，函数把控制权返回给调用之后的语句或指令。这种高级抽象实现起来要靠堆栈的帮助。堆栈也用于给函数中使用的局部变量动态分配空间，同样给函数传递参数和函数返回值也要用到堆栈。堆栈区域堆栈是一块保存数据的连续内存。一个名为堆栈指针(SP)的寄存器指向堆栈的顶部。堆栈的底部在一个固定的地址。堆栈的大小在运行时由内核动态地调整。 CPU实现指令 PUSH和POP，向堆栈中添加元素和从中移去元素。堆栈由逻辑堆栈帧组成。当调用函数时逻辑堆栈帧被压入栈中，当函数返回时逻辑堆栈帧被从栈中弹出。堆栈帧包括函数的参数，函数地局部变量，以及恢复前一个堆栈帧所需要的数据，其中包括在函数调用时指令指针(IP)的值。堆栈既可以向下增长(向内存低地址)也可以向上增长，这依赖于具体的实现。在我们的例子中，堆栈是向下增长的。这是很多计算机的实现方式，包括Intel， Motorola， SPARC和MIPS处理器。堆栈指针(SP)也是依赖于具体实现的。它可以指向堆栈的最后地址，或者指向堆栈之后的下一个空闲可用地址。在我们的讨论当中， SP指向堆栈的最后地址。除了堆栈指针(SP指向堆栈顶部的的低地址)之外，为了使用方便还有指向帧内固定地址的指针叫做帧指针(FP)。有些文章把它叫做局部基指针(LB-local base pointer)。从理论上来说，局部变量可以用SP加偏移量来引用。然而，当有字被压栈和出栈后，这些偏移量就变了。尽管在某些情况下编译器能够跟踪栈中的字操作，由此可以修正偏移量，但是在某些情况下不能。而且在所有情况下，要引入可观的管理开销。而且在有些机器上，比如Intel处理器，由SP加偏移量访问一个变量需要多条指令才能实现。因此，许多编译器使用第二个寄存器， FP，对于局部变量和函数参数都可以引用，因为它们到FP的距离不会受到PUSH和POP操作的影响。在Intel CPU中， BP(EBP)用于这个目的。在Motorola CPU中，除了A7(堆栈指针SP)之外的任何地址寄存器都可以做FP。考虑到我们堆栈的增长方向，从FP的位置开始计算，函数参数的偏移量是正值，而局部变量的偏移量是负值。当一个例程被调用时所必须做的第一件事是保存前一个FP(这样当例程退出时就可以恢复)。然后它把SP复制到FP，创建新的FP，把SP向前移动为局部变量保留空间。这称为例程的序幕(prolog)工作。当例程退出时，堆栈必须被清除干净，这称为例程的收尾 (epilog)工作。 Intel的ENTER和LEAVE指令， Motorola的LINK和UNLINK指令，都可以用于有效地序幕和收尾工作。堆栈溢出堆栈溢出就是不顾堆栈中分配的局部数据块大小，向该数据块写入了过多的数据，导致数据越界，结果覆盖了老的堆栈数据。或者解释为在长字符串中嵌入一段代码，并将过程的返回地址覆盖为这段代码的地址，这样当过程返回时，程序就转而开始执行这段自编的代码了.

博客介绍

正文

堆栈溢出原理2007-04-14 18:48:00

评论