Linux内核代码阅读序列(10)-内存模型 之二

内存区段

x86结构CPU上采用了一种叫内存区段的方式来寻址,这样做最大的好处就是可以保护内存中的内容不被非法访问,在这种内存模型中某个地址可以被表示成两部分,线性地址由这两部分计算得出。

LinearAddress = BaseAddress of Segmentation + Offset

其中,段基值存储在段基值寄存器当中,其值总是指向当前正在使用的内存区域的基地址;在x86处理器的32位保护模式中,一个区段的大小时4GB;这是因为32位CPU上,段基值寄存器的位宽是32位(2^32=4G)。x86的原始设计包含三个段基址寄存器,

  • CS Register:CodeSeg 指令段基址寄存器
  • DS Register:DataSeg 数据段基址寄存器
  • SS Register:StackSeg 栈段基址寄存器

同时,x86结构上将一个被叫做段描述符(Segmentation Descriptor)的东西存储在两个表(GDT和LDT)之中,需要使用时从表中取出段描述符来找到线性地址;因为Linux操作系统最初的设计目标就是支持x86结构的计算机,所以,Linux内核在构建内存模型的时候也采取了内存区段的方式,但是,为了简化设计和提高可以执行,内核的做法是只保留一个存储段描述符的表(GDT)和一个段基址寄存器,从而让所有的段都开始于同一个位置,而段的大小也正好成为4GB,也就是一般情况下的整个线性地址空间的大小。正因为如此,在大多数情况下,逻辑地址就可以直接被看作线性地址来使用,而逻辑地址到线性地址的转换事实上时内核或者CPU在对用户透明的情况下完成的,这个转换过程不需要特别注意。需要注意的是这里提到的这些名词,以及那个小学算数一般的地址计算方法。此外,Linux内核代码使用的内存区段和若干个宏也最好记住,因为你知道,好记性对一个程序员来说真tmd重要。

Name Macro Base Limit G S Type DPL
KernelCodeSeg __KERNEL_CS 0x00000000 0xffffffff 1 1 0xa 0
KernelDataSeg __KERNEL_DS 0x00000000 0xffffffff 1 1 0x10 0
UserCodeSeg __USER_DS 0x00000000 0xffffffff 1 1 0xa 3
UserDataSeg __USER_DS 0x00000000 0xffffffff 1 1 0x10 3

线性地址在使用上的划分

普通的x86结构计算机上,从用户的角度看,线性地址是一个连续内存区域。它的最小地址是0x0000 0000,而最大地址是0xffff ffff。这个区域在概念上被分成两个部分,一部分是会根据不同的进程切换而改变的userspace区域,而另一部分,则在系统启动后一直不变的kernel space区域。这个位置的分界点可在内核代码中通过PAGE_OFFSET宏来定义,而PAGE_OFFSET却来自于内核编译的配置文件.config中的CONFIG_PAGE_OFFSET。在x86结构上,它被定义为0xC000 0000;这意味着,用户空间的大小时3GB,而内核仅有1GB可以使用。

 |<---          3GB          ---->|<----  1GB ---->|
 +--------------------------------+----------------+
 |     userspace                  | kernel space   |
 +--------------------------------+----------------+
                            PAGE_OFFSET
                           (0xC000 0000)

内核在系统启动时被Bootloader——x86结构上常用的是GRUB/2——装载到线性地址的0xC000 0000位置以后,而这个线性地址通常被映射到物理地址的0x0010 0000,也就是物理地址最初的1M以后,关于这里点的证明此后详述。在线性地址空间中,紧随内核装载位置之后,Linux会利用一段内存区域来加载物理内存管理需要使用的数据结构,这个区域的大小一般根据系统上可以使用的RAM的大小而改变,而其装载在物理内存中的位置会根据体系结构的不同而改变,但通常会避开前16M,因为最初的16M被用来给ISA设备提供DMA支持,这是物理内存管理中另外一个恼人的地方,且听下下回分解吧。此前提到的这两个区域都时直接的物理内存映射区域,具体的位置用内核宏定义来说的话应该时开始于PAGE_OFFSET,而结束于(VMALLOC_START-VMALLOC_OFFSET)。-_-!!! 抱歉,又说火星语了,但是除此以外还真没有好的描述语言。

                             VMALLOC_OFFSET(0x0080 0000)
                                  ¥ | ¥
     +-----------+----------------+---+-------------------+
     |KernelImage|PhysicalMMStruct|Gap| vmalloc Add Space |
     +-----------+----------------+---+-------------------+
     ^                                |
     |                           VMALLOC_START
  PAGE_OFFSET
(0xC000 0000)

显而易见,VMALLOC_START = SizeOf(PhysicalMMStruct) + VMALLOC_OFFSET。后续的线性地址空间被用以支持内核函数vmalloc(),使用这个函数可以申请在线性地址空间连续的却事实上在物理地址上可能不连续的内存区域;如果在支持HIGH_MEM的系统上,在两个PAGE的间隔以后,会有一块区域来支持将高地址转化到低地址的函数kmap(),这个区域的开始位置是PKMAP_BASE。为什么要转换呢?下下下下回分解…再接下来,还需要划分一片区域来支持编译时就需要定位的内存模块,比如APIC,这段区域采用固定映射(Fixed Mapping)的方式,将线性地址映射到物理地址,所以,利用链接器脚本或者其他方法可以在编译时确认代码被装载的位置;这片内存区域的开始位置是FIXADDR_START,而结束位置时FIXADDR_TOPFIXADDR_TOP0xffff f000,而FIXADDR_START会根据宏__FIXADDR_START计算得出。

     +--------------------+---+--------------+-------------------------+---+
     | vmalloc Add Space  |Gap|kmap Add space|Fixed Virtual Add Mapping|Gap|
     +--------------------+---+--------------+-------------------------+---+
     |           VMALLOC_END  |              |                         |
     |                  PKMAP_BASE           |                  FIXEADDR_TOP
VMALLOC_START                         FIXADDR_START

正是因为前面提到vmalloc()kmap()和固定映射地址,内核物理内存区域管理中用到的ZONE_NORMAL的大小才受到限制,而不能占据整个1GB空间。这个限制通过宏定义VMALLOC_RESERVE体现出来,这个值在不同的体系结构上有所不同,但是在x86结构上,它被定义为128MB,理所当然的,ZONE_NORMAL可以使用的线性地址空间大小就变成了1GB - 128MB = 896MB

发表评论