Linux内核源码阅读系列(7)-链接4

可执行目标文件

静态连接的目标输出是“可执行的目标文件”,它的基本形式当然也是ELF。只是,“可执行目标文件”与“可重定位目标文件”一些重要的区别。产生这种区别的原因在于这两种文件的目的不同。“可重定位目标文件”的目的是提供给链接器(静态链接的ld或者动态链接的ld.so)链接信息以便帮助可执行文件。而“可执行目标文件”的目的在于提供一种形式将程序的代码方便的加载到内存中以便执行。所以,“可执行的目标文件”中增加了一个叫做“段头表”(segment header table)的部分,这个表中描述了文件内容到主存的映射方法,在程序运行时,加载器(loader)将根据这个表的信息把“可执行目标文件”中的代码拷贝到主存中去。

内存布局

下面的图展示了一个典型的可执行目标文件的构成,以及在取其相应的内存“镜像”之间的简单关系(并不严格)。

 +----------------------+
 |    ELF header        |
 +----------------------+     +--------------------+ 0x00000000
 | segment header table |     |       NO USAGE     |
 +----------------------+     +--------------------+ 0x08048000
 |       .init          | - > |  read-only segment |
 +----------------------+     |                    |
 |       .text          | - > |  (size <= 4kb*n)   |
 +----------------------+     |                    |
 |       .rodata        | - > |  ......            |
 +----------------------+     +--------------------+
 |       .data          | - > | read-write segment |
 +----------------------+     |  (size <= 4kb*m)   |
 |        .bss          | - > |  .....             |
 x----------------------x     +--------------------+
 /        .symtab       /     |       heap         |
 x----------------------x     +--------------------+
 /      .rel.text       /     |        ↓           |
 x----------------------x     |                    |
 /      .rel.data       /     +--------------------+ 0x40000000
 x----------------------x     |   shared library   |
 /       .debug         /     | memory map area    |
 x----------------------x     +--------------------+
 /       .line          /     |        ↓           |
 x----------------------x     |        ↑           |
 /       .strtab        /     +--------------------+
 x----------------------x     |      stack         |
 / section header table /     +--------------------+ 0xbfffffff
 x----------------------x     |      kernel        |
                              +--------------------+

在IA32结构上,Linux采用虚拟内存(virtual memory)技术,所以,每个程序在内存布局的时候都好像已经拿到了所有的内存一样,而程序代码最开始的地方总是在虚拟地址0x08048000处。加载器从这里开始拷贝ELF中定义的只读代码,这些只读代码通常被包含在.init.text.rodate段;所谓段和节事实上同样的,只是在链接的时候,它被称为“节”,而加载时却被成为“段”。.init段是链接器给每个“可执行目标文件”添加的,在其中包含了程序的初始化代码的一部分;链接器在其中写入了一个叫做_init的函数,这个细节需要注意。只读代码要求4kb对齐,所以虽然它实际的大小为往往小于4kb*n,但是其后紧跟的读/写段却需要从4kb*n的虚拟内存处开始。同样,读/写段也需要4kb对齐(想想why?)。读写段之后紧跟的是堆(heap)的内存区域,众所周知,这个区域是为了malloc函数群动态分配的内存准备的;此外,这个区域将根据需要向上(向高地址区域)增长。ELF文件中的.symtab.debug等内容并不会被加载进入内存,上图中用斜线表示了。操作系统还会为这个程序在内存的0x40000000处准备了动态加载的共享库代码区域;0xbfffffff处准备了另一个重要的运行时数据结构“栈”,这个区域主要用于程序中的过程调用,并且区域大小向下增长。用于应用程序的空间到这里结束了,紧跟在运行时栈的栈底后面的区域,也就是从0xc0000000开始就是内核代码了。

加载器(loader)通常是shell呼出的,但是任何应用程序都可以通过系统调用execve()调用加载器。

内存访问越界的时候通常你会被警告很奇怪的消息”segment fault”,并且程序终了。相信这个会帮助你,让你对“段”的记忆更加深刻些了,哈哈哈。这是一句很笼统的提示,但他说的就是你的指针在乱跳,可能对只读内存区域进行了写操作。

启动代码

加载器运行时,首先构造一个上面提到的那样的内存映像,然后根据“段头表”的指引,将程序代码拷贝到内存中。接着,他会跳转到程序的入口开始执行程序。提到c语言的程序入口,那可不就是大名鼎鼎的main函数么?这个说法没错,但是也不全对。真正的程序入口是一个叫做_start的函数,这个函数被包含在crtl.o文件中。这个目标文件是C语言运行时环境的一部分。它的大致的示意代码如下所示:

0x080480c0 <_start>        /*  .text段的入口点                 */
  call _libc_init_first     /* 启动.text节的代码通常是初始化c的库  */
  call _init               /* 启动_init代码,也就是在_init段中   */
  call atexit              /* 注册一些在程序结束时需要作的动作     */
  call main                /* 应用程序的入口点                  */
  call _exit               /* 结束应用程序,将控制权返还给操作系统  */

很明显,c语言的main函数是约定好的,如果没有这个函数程序将不能被执行。关于ctrl.o这个事情,让我想起面试国内某家公司的时候,曾被面试官问到这个问题;他问c程序在调用main之前需要做哪些动作,当时刚刚毕业,我的回答是现编的……,当然是错的很离谱,恩,往事不堪回首。如果你经常看到编译时或者运行时提示找不到crtl.o文件,恭喜你,你可以记住它了。嘿嘿。

动态链接和PIC代码

顾名思义,动态链接就是将链接过程从编译时挪到了运行时。这个内容写起来会有如“懒婆娘的裹脚”,各位看官可以参照IBM developerWorks的文章。但是动态链接对于立志做个好程序员的有痔青年是非常重要的内容,所以,如果有时间还是要认真研究的。简单的过程应该是像这样的

生成.so


gcc -shared -fPIC -o libvector.so x.c y.c z.c

这个过程就是将源代码文件编译成为目标文件,然后在用PIC指定它进行特殊的链接重定位定位信息,其中比较重要的就是添加PLT(procedure linkage table)和GOT(global offset table)。PLT被添加到.text节,而GOT被添加到.data节。PIC代码有个缺陷,就是因为对GOT的存储器引用造成的,具有大量寄存器堆的机器上没有太大问题,但是,寄存器不足的机器上却会造成严重缺陷。比如,MIPS结构的GOT问题就由来已久。对于外部过程的调用,PIC代码中采用一种叫做“延迟绑定”(lazy binding)技术,这个也是需要好好学习一下的。

链接共享库


gcc -o prog main.c libvector.so

这个链接过程不像静态链接过程,链接器并不真正的拷贝共享库中的.text.data节到可执行文件之中。相反,链接器会拷贝一些重定位和符号表信息,以便运行时可以解析对共享库代码和数据的引用。如你说知道的,这个过程就是在那个著名的$LD_LIBRARY_PATH之中去寻找共享库文件。

动态加载动态链接共享库


gcc -rdynamic -o prog main.c -ldl

通过dlopen()等函数可以在程序中动态地加载和链接共享库,在编译该程序时,只要连接libdl就可以了。而运行时,这个动态的加载和链接过程需要在被称为动态链接器的ld.so帮助下完成。这种方法特别灵活,因此被在各种各样的系统中广泛得应用,比如Java中的JNI(Java Native Interface),通过它可以让Java程序调用本地的C或者C++函数库。

这篇文章的目的在于说明一个程序是怎样形成,怎样加载,最终怎样在Linux中执行的,目的已经达到了,我就不再罗嗦了。

发表评论