您當前位置：首頁 > 互聯網 > windows和Linux內存的對齊方式

windows和Linux內存的對齊方式

來源：程序員人生發布時間：2014-11-18 09:06:31 閱讀次數：3198次

1.內存對齊的初步講授

內存對齊可以用1句話來概括：

“數據項只能存儲在地址是數據項大小的整數倍的內存位置上”

例如int類型占用4個字節，地址只能在0，4，8等位置上。

例1：

#include <stdio.h>
struct xx{
        char b;
        int a;
        int c;
        char d;
};

int main()
{
        struct xx bb;
        printf("&a = %p ", &bb.a);
        printf("&b = %p ", &bb.b);
        printf("&c = %p ", &bb.c);
        printf("&d = %p ", &bb.d);
        printf("sizeof(xx) = %d ", sizeof(struct xx));

return 0;
}

履行結果以下：

&a = ffbff5ec
&b = ffbff5e8
&c = ffbff5f0
&d = ffbff5f4
sizeof(xx) = 16

會發現b與a之間空出了3個字節，也就是說在b以后的0xffbff5e9,0xffbff5ea,0xffbff5eb空了出來，a直接存儲在了0xffbff5ec，由于a的大小是4，只能存儲在4個整數倍的位置上。打印xx的大小會發現，是16，有些人可能要問，b以后空出了3個字節，那也應當是13啊？其余的3個呢？這個往后瀏覽本文會理解的更深入1點，這里簡單說1下就是d后邊的3個字節，也會浪費掉，也就是說，這3個字節也被這個結構體占用了.

可以簡單的修改結構體的結構，來下降內存的使用，例如可以將結構體定義為：
struct xx{
        char b;
        char d;
        int a;
        int c;
};

這樣打印這個結構體的大小就是12，省了很多空間，可以看出，在定義結構體的時候，1定要斟酌要內存對齊的影響，這樣能使我們的程序占用更小的內存。

2.操作系統的默許對齊系數

每個操作系統都有自己的默許內存對齊系數，如果是新版本的操作系統，默許對齊系數1般都是8，由于操作系統定義的最大類型存儲單元就是8個字節，例如 long long（為何1定要這樣，在第3節會講授），不存在超過8個字節的類型（例如int是4，char是1，long在32位編譯時是4，64位編譯時是 8）。當操作系統的默許對齊系數與第1節所講的內存對齊的理論產生沖突時，以操作系統的對齊系數為基準。

例如：

假定操作系統的默許對齊系數是4，那末對與long long這個類型的變量就不滿足第1節所說的，也就是說long long這類結構，可以存儲在被4整除的位置上，也能夠存儲在被8整除的位置上。

可以通過#pragma pack()語句修改操作系統的默許對齊系數，編寫程序的時候不建議修改默許對齊系數，在第3節會講授緣由

例2：

#include <stdio.h>
#pragma pack(4)
struct xx{
        char b;
        long long a;
        int c;
        char d;
};
#pragma pack()

return 0;
}
打印結果為：

&a = ffbff5e4
&b = ffbff5e0
&c = ffbff5ec
&d = ffbff5f0
sizeof(xx) = 20

發現占用8個字節的a，存儲在了不能被8整除的位置上，存儲在了被4整除的位置上，采取了操作系統的默許對齊系數。

3.內存對齊產生的緣由

內存對齊是操作系統為了快速訪問內存而采取的1種策略，簡單來講，就是為了放置變量的2次訪問。操作系統在訪問內存時，每次讀取1定的長度（這個長度就是操作系統的默許對齊系數，或是默許對齊系數的整數倍）。如果沒有內存對齊時，為了讀取1個變量是，會產生總線的2 次訪問。

例如假定沒有內存對齊，結構體xx的變量位置會出現以下情況：

struct xx{
        char b;         //0xffbff5e8
        int a;            //0xffbff5e9
        int c;             //0xffbff5ed
        char d;         //0xffbff5f1
};

操作系統先讀取0xffbff5e8-0xffbff5ef的內存，然后在讀取0xffbff5f0-0xffbff5f8的內存，為了取得值c，就需要將兩組內存合并，進行整合，這樣嚴重下降了內存的訪問效力。（這就觸及到了陳詞濫調的問題，空間和效力哪一個更重要？這里不做討論）。

這樣大家就可以理解為何結構體的第1個變量，不管類型如何，都是能被8整除的吧（由于訪問內存是從8的整數倍開始的，為了增加讀取的效力）！

內存對齊的問題主要存在于理解struct等復合結構在內存中的散布。

首先要明白內存對齊的概念。
許多實際的計算機系統對基本類型數據在內存中寄存的位置有限制，它們會要求這些數據的首地址的值是某個數k(通常它為4或8)的倍數，這就是所謂的內存對齊。

這個k在不同的cpu平臺下，不同的編譯器下表現也有所不同。比如32位字長的計算機與16位字長的計算機。這個離我們有些遠了。我們的開發主要觸及兩大平臺，windows和linux（unix），觸及的編譯器也主要是microsoft編譯器(如cl),和gcc。

內存對齊的目的是使各個基本數據類型的首地址為對應k的倍數，這是理解內存對齊方式的終極寶貝。另外還要辨別編譯器的分別。明白了這兩點基本上就可以弄定所有內存對齊方面的問題。

不同編譯器中的k：
1、對microsoft的編譯器，每種基本類型的大小即為這個k。大體上char類型為8，int為32，long為32，double為64。
2、對linux下的gcc編譯器，規定大小小于等于2的，k值為其大小，大于等于4的為4。

明白了以上的說明對struct等復合結構的內存散布就應當很清楚了。

下面看1下最簡單的1個類型：struct中成員都為基本數據類型，例如：
struct test1
{
char a;
short b;
int c;
long d;
double e;
};

在windows平臺，microsoft編譯器下：

假定從0地址開始，首先a的k值為1，它的首地址可使任意位置，所以a占用第1個字節，即地址0；然后b的k值為2，他的首地址必須是2的倍數，不能是1，所以地址1那個字節被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，他的k值為8，首地址為8的倍數，所以地址12，13，14，15被填充，他的首地址應為16，占用地址16⑵3。明顯其大小為24。

這就是 test1在內存中的散布情況。我們建立1個test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址順次打印出內存中每一個字節對應的16進制數為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 40 40

驗證：
明顯推斷是正確的。

在linux平臺，gcc編譯器下：
假定從0地址開始，首先a的k值為1，它的首地址可使任意位置，所以a占用第1個字節，即地址0；然后b的k值為2，他的首地址必須是2的倍數，不能是1，所以地址1那個字節被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，從這里開始與microsoft的編譯器開始有所差異，他的k值為不是8，依然是4，所以其首地址是12，占用地址12⑴9。明顯其大小為20。

驗證：
我們建立1個test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址順次打印出內存中每一個字節對應的16進制數為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 40 40

明顯推斷也是正確的。

接下來，看1看幾類特殊的情況，為了不麻煩，不再描寫內存散布，只計算結構大小。

第1種：嵌套的結構
struct test2
{
char f;
struct test1 g;
};

在windows平臺，microsoft編譯器下：

這類情況下如果把test2的第2個成員拆開來，研究內存散布，那末可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內存散布不變，依然滿足所有基本數據成員的首地址都為其對應k的倍數這1原則，那末test2的大小就還是24了。但是實際上test2的大小為32，這是由于：不能由于test2的結構而改變test1的內存散布情況，所以為了使test1種各個成員依然滿足對齊的要求，f成員后面需要填充1定數量的字節，不難發現，這個數量應為7個，才能保證test1的對齊。所以test2相對test1來講增加了8個字節，所以test2的大小為32。

在linux平臺，gcc編譯器下：

一樣，這類情況下如果把test2的第2個成員拆開來，研究內存散布，那末可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內存散布不變，依然滿足所有基本數據成員的首地址都為其對應k的倍數這1原則，那末test2的大小就還是20了。但是實際上test2的大小為24，一樣這是由于：不能由于test2的結構而改變test1的內存散布情況，所以為了使test1種各個成員依然滿足對齊的要求，f成員后面需要填充1定數量的字節，不難發現，這個數量應為3個，才能保證test1的對齊。所以test2相對test1來講增加了4個字節，所以test2的大小為24。

第2種：位段對齊

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
或
struct test3
{
unsigned int a:4;
int b:4;
char c;
};

在windows平臺，microsoft編譯器下：

相鄰的多個同類型的數(帶符號的與不帶符號的，只要基本類型相同，也為相同的數),如果他們占用的位數不超過基本類型的大小，那末他們可作為1個整體來看待。不同類型的數要遵守各自的對齊方式。
如：test3中，a、b可作為1個整體，他們作為1個int型數據來看待，所以test3的大小為8字節。并且a與b的值在內存中從低位開始順次排列，位于4字節區域中的前0⑶位和4⑺位

如果test4位以下格式
struct test4
{
unsigned int a:30;
unsigned int b:4;
char c;
};
那末test4的大小就為12個字節，并且a與b的值分別散布在第1個4字節的前30位，和第2個4字節的前4位。

如過test5是以下情勢
struct test5
{
unsigned int a:4;
unsigned char b:4;
char c;
};

那末由于int和char不同類型，他們分別以各自的方式對齊，所以test5的大小應為8字節，a與b的值分別位于第1個4字節的前4位和第5個字節的前4位。

在linux平臺，gcc編譯器下：

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};
gcc下，相鄰各成員，不管類型是不是相同，占的位數之和超過這些成員中第1個的大小的時候，在結構中以k值為1對齊，在結構外k值為其基本類型的值。不超過的情況下在內存中順次排列。
如test3，其大小為4。a，b的值在內存中順次排列分別為第1個4字節中的0⑶和4⑺位。

如果test4位以下格式
struct test4
{
unsigned int a:20;
unsigned char b:4;
char c;
};
test4的大小為4個字節，并且a與b的值分別散布在第1個4字節的0⑴9位，和20⑵3位，c寄存在第4個字節中。
如過test5是以下情勢
struct test5
{
unsigned int a:10;
unsigned char b:4;
short c;
};

那末test5的大小應為4字節，a，b的值為0⑼位和10⑴3位。c寄存在后兩個字節中。如果a的大小變成了20
那末test5的大小應為8字節。即

struct test6
{
unsigned int a:20;
unsigned char b:4;
short c;
};

此時，test6的a、b共占用0，1，2共3字節，c的k值為2，其實可以4位首位置，但是在結構外，a要以int的方式對齊。也就是說連續兩個test6對象在內存中寄存的話，a的首位置要保證為4的倍數，那末c后面必須多填充2位。所以test6的大小為8個字節。

關于位段結構的部份是比較復雜的。暫時我就知道這么多。

生活不易，碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生