腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

深入理解C語(yǔ)言內(nèi)存對(duì)齊

更新時(shí)間：2013年12月06日 16:28:37 作者：

這篇文章主要介紹了C語(yǔ)言內(nèi)存對(duì)齊，有需要的朋友可以參考一下

一.內(nèi)存對(duì)齊的初步講解

內(nèi)存對(duì)齊可以用一句話來(lái)概括：

“數(shù)據(jù)項(xiàng)只能存儲(chǔ)在地址是數(shù)據(jù)項(xiàng)大小的整數(shù)倍的內(nèi)存位置上”

例如int類型占用4個(gè)字節(jié)，地址只能在0，4，8等位置上。

例1：

復(fù)制代碼代碼如下:

#include <stdio.h>
struct xx{
        char b;
        int a;
        int c;
        char d;
};

int main()
{
        struct xx bb;
        printf("&a = %p/n", &bb.a);
        printf("&b = %p/n", &bb.b);
        printf("&c = %p/n", &bb.c);
        printf("&d = %p/n", &bb.d);
        printf("sizeof(xx) = %d/n", sizeof(struct xx));

return 0;
}

執(zhí)行結(jié)果如下：

復(fù)制代碼代碼如下:

&a = ffbff5ec
&b = ffbff5e8
&c = ffbff5f0
&d = ffbff5f4
sizeof(xx) = 16

會(huì)發(fā)現(xiàn)b與a之間空出了3個(gè)字節(jié)，也就是說(shuō)在b之后的0xffbff5e9,0xffbff5ea,0xffbff5eb空了出來(lái)，a直接存儲(chǔ)在了0xffbff5ec，因?yàn)閍的大小是4，只能存儲(chǔ)在4個(gè)整數(shù)倍的位置上。打印xx的大小會(huì)發(fā)現(xiàn)，是16，有些人可能要問(wèn)，b之后空出了3個(gè)字節(jié)，那也應(yīng)該是13?。科溆嗟?個(gè) 呢？這個(gè)往后閱讀本文會(huì)理解的更深入一點(diǎn)，這里簡(jiǎn)單說(shuō)一下就是d后邊的3個(gè)字節(jié)，也會(huì)浪費(fèi)掉，也就是說(shuō)，這3個(gè)字節(jié)也被這個(gè)結(jié)構(gòu)體占用了.

可以簡(jiǎn)單的修改結(jié)構(gòu)體的結(jié)構(gòu)，來(lái)降低內(nèi)存的使用，例如可以將結(jié)構(gòu)體定義為：

復(fù)制代碼代碼如下:

struct xx{
        char b; 
        char d;
        int a;          
        int c;                  
};

這樣打印這個(gè)結(jié)構(gòu)體的大小就是12，省了很多空間，可以看出，在定義結(jié)構(gòu)體的時(shí)候，一定要考慮要內(nèi)存對(duì)齊的影響，這樣能使我們的程序占用更小的內(nèi)存。

二.操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)

每個(gè)操作系統(tǒng)都有自己的默認(rèn)內(nèi)存對(duì)齊系數(shù)，如果是新版本的操作系統(tǒng)，默認(rèn)對(duì)齊系數(shù)一般都是8，因?yàn)椴僮飨到y(tǒng)定義的最大類型存儲(chǔ)單元就是8個(gè)字節(jié)，例如 long long（為什么一定要這樣，在第三節(jié)會(huì)講解），不存在超過(guò)8個(gè)字節(jié)的類型（例如int是4，char是1，long在32位編譯時(shí)是4，64位編譯時(shí)是 8）。當(dāng)操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)與第一節(jié)所講的內(nèi)存對(duì)齊的理論產(chǎn)生沖突時(shí)，以操作系統(tǒng)的對(duì)齊系數(shù)為基準(zhǔn)。

例如：

假設(shè)操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)是4，那么對(duì)與long long這個(gè)類型的變量就不滿足第一節(jié)所說(shuō)的，也就是說(shuō)long long這種結(jié)構(gòu)，可以存儲(chǔ)在被4整除的位置上，也可以存儲(chǔ)在被8整除的位置上。

可以通過(guò)#pragma pack()語(yǔ)句修改操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)，編寫程序的時(shí)候不建議修改默認(rèn)對(duì)齊系數(shù)，在第三節(jié)會(huì)講解原因

例2：

復(fù)制代碼代碼如下:

#include <stdio.h>
#pragma pack(4)
struct xx{
        char b;
        long long a;
        int c;
        char d;
};
#pragma pack()

int main()
{
        struct xx bb;
        printf("&a = %p/n", &bb.a);
        printf("&b = %p/n", &bb.b);
        printf("&c = %p/n", &bb.c);
        printf("&d = %p/n", &bb.d);
        printf("sizeof(xx) = %d/n", sizeof(struct xx));

return 0;
}

打印結(jié)果為：

復(fù)制代碼代碼如下:

&a = ffbff5e4
&b = ffbff5e0
&c = ffbff5ec
&d = ffbff5f0
sizeof(xx) = 20

發(fā)現(xiàn)占用8個(gè)字節(jié)的a，存儲(chǔ)在了不能被8整除的位置上，存儲(chǔ)在了被4整除的位置上，采取了操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)。

三.內(nèi)存對(duì)齊產(chǎn)生的原因

內(nèi)存對(duì)齊是操作系統(tǒng)為了快速訪問(wèn)內(nèi)存而采取的一種策略，簡(jiǎn)單來(lái)說(shuō)，就是為了放置變量的二次訪問(wèn)。操作系統(tǒng)在訪問(wèn)內(nèi)存時(shí)，每次讀取一定的長(zhǎng)度（這個(gè)長(zhǎng)度就是操作系統(tǒng)的默認(rèn)對(duì)齊系數(shù)，或者是默認(rèn)對(duì)齊系數(shù)的整數(shù)倍）。如果沒(méi)有內(nèi)存對(duì)齊時(shí)，為了讀取一個(gè)變量是，會(huì)產(chǎn)生總線的二次訪問(wèn)。

例如假設(shè)沒(méi)有內(nèi)存對(duì)齊，結(jié)構(gòu)體xx的變量位置會(huì)出現(xiàn)如下情況：

復(fù)制代碼代碼如下:

struct xx{
        char b;         //0xffbff5e8
        int a;            //0xffbff5e9       
        int c;             //0xffbff5ed      
        char d;         //0xffbff5f1
};

操作系統(tǒng)先讀取0xffbff5e8-0xffbff5ef的內(nèi)存，然后在讀取0xffbff5f0-0xffbff5f8的內(nèi)存，為了獲得值c，就需要將兩組內(nèi)存合并，進(jìn)行整合，這樣嚴(yán)重降低了內(nèi)存的訪問(wèn)效率。（這就涉及到了老生常談的問(wèn)題，空間和效率哪個(gè)更重要？這里不做討論）。

這樣大家就能理解為什么結(jié)構(gòu)體的第一個(gè)變量，不管類型如何，都是能被8整除的吧（因?yàn)樵L問(wèn)內(nèi)存是從8的整數(shù)倍開(kāi)始的，為了增加讀取的效率）！

內(nèi)存對(duì)齊的問(wèn)題主要存在于理解struct等復(fù)合結(jié)構(gòu)在內(nèi)存中的分布。

首先要明白內(nèi)存對(duì)齊的概念。
許多實(shí)際的計(jì)算機(jī)系統(tǒng)對(duì)基本類型數(shù)據(jù)在內(nèi)存中存放的位置有限制，它們會(huì)要求這些數(shù)據(jù)的首地址的值是某個(gè)數(shù)k(通常它為4或8)的倍數(shù)，這就是所謂的內(nèi)存對(duì)齊。

這個(gè)k在不同的cpu平臺(tái)下，不同的編譯器下表現(xiàn)也有所不同。比如32位字長(zhǎng)的計(jì)算機(jī)與16位字長(zhǎng)的計(jì)算機(jī)。這個(gè)離我們有些遠(yuǎn)了。我們的開(kāi)發(fā)主要涉及兩大平臺(tái)，windows和linux（unix），涉及的編譯器也主要是microsoft編譯器(如cl),和gcc。

內(nèi)存對(duì)齊的目的是使各個(gè)基本數(shù)據(jù)類型的首地址為對(duì)應(yīng)k的倍數(shù)，這是理解內(nèi)存對(duì)齊方式的終極法寶。另外還要區(qū)分編譯器的分別。明白了這兩點(diǎn)基本上就能搞定所有內(nèi)存對(duì)齊方面的問(wèn)題。

不同編譯器中的k：
1、對(duì)于microsoft的編譯器，每種基本類型的大小即為這個(gè)k。大體上char類型為8，int為32，long為32，double為64。
2、對(duì)于linux下的gcc編譯器，規(guī)定大小小于等于2的，k值為其大小，大于等于4的為4。

明白了以上的說(shuō)明對(duì)struct等復(fù)合結(jié)構(gòu)的內(nèi)存分布就應(yīng)該很清楚了。

下面看一下最簡(jiǎn)單的一個(gè)類型：struct中成員都為基本數(shù)據(jù)類型，例如：

復(fù)制代碼代碼如下:

struct test1
{
char a;
short b;
int c;
long d;
double e;
};

在windows平臺(tái)，microsoft編譯器下：

假設(shè)從0地址開(kāi)始，首先a的k值為1，它的首地址可以使任意位置，所以a占用第一個(gè)字節(jié)，即地址0；然后b的k值為2，他的首地址必須是2的倍數(shù)，不能是1，所以地址1那個(gè)字節(jié)被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數(shù)，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，他的k值為8，首地址為8的倍數(shù)，所以地址12，13，14，15被填充，他的首地址應(yīng)為16，占用地址16-23。顯然其大小為24。

這就是 test1在內(nèi)存中的分布情況。我們建立一個(gè)test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址依次打印出內(nèi)存中每個(gè)字節(jié)對(duì)應(yīng)的16進(jìn)制數(shù)為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 40 40

驗(yàn)證：
顯然推斷是正確的。

在linux平臺(tái)，gcc編譯器下：
假設(shè)從0地址開(kāi)始，首先a的k值為1，它的首地址可以使任意位置，所以a占用第一個(gè)字節(jié)，即地址0；然后b的k值為2，他的首地址必須是2的倍數(shù)，不能是1，所以地址1那個(gè)字節(jié)被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數(shù)，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，從這里開(kāi)始與microsoft的編譯器開(kāi)始有所差異，他的k值為不是8，仍然是4，所以其首地址是12，占用地址12-19。顯然其大小為20。

驗(yàn)證：
我們建立一個(gè)test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址依次打印出內(nèi)存中每個(gè)字節(jié)對(duì)應(yīng)的16進(jìn)制數(shù)為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 40 40

顯然推斷也是正確的。

接下來(lái)，看一看幾類特殊的情況，為了避免麻煩，不再描述內(nèi)存分布，只計(jì)算結(jié)構(gòu)大小。

第一種：嵌套的結(jié)構(gòu)

復(fù)制代碼代碼如下:

struct test2
{
char f;
struct test1 g;
};

在windows平臺(tái)，microsoft編譯器下：

這種情況下如果把test2的第二個(gè)成員拆開(kāi)來(lái)，研究?jī)?nèi)存分布，那么可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內(nèi)存分布不變，仍然滿足所有基本數(shù)據(jù)成員的首地址都為其對(duì)應(yīng)k的倍數(shù)這一原則，那么test2的大小就還是24了。但是實(shí)際上test2的大小為32，這是因?yàn)椋翰荒芤驗(yàn)閠est2的結(jié)構(gòu)而改變test1的內(nèi)存分布情況，所以為了使test1種各個(gè)成員仍然滿足對(duì)齊的要求，f成員后面需要填充一定數(shù)量的字節(jié)，不難發(fā)現(xiàn)，這個(gè)數(shù)量應(yīng)為7個(gè)，才能保證test1的對(duì)齊。所以test2相對(duì)于test1來(lái)說(shuō)增加了8個(gè)字節(jié)，所以test2的大小為32。

在linux平臺(tái)，gcc編譯器下：

同樣，這種情況下如果把test2的第二個(gè)成員拆開(kāi)來(lái)，研究?jī)?nèi)存分布，那么可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內(nèi)存分布不變，仍然滿足所有基本數(shù)據(jù)成員的首地址都為其對(duì)應(yīng)k的倍數(shù)這一原則，那么test2的大小就還是20了。但是實(shí)際上test2的大小為24，同樣這是因?yàn)椋翰荒芤驗(yàn)閠est2的結(jié)構(gòu)而改變test1的內(nèi)存分布情況，所以為了使test1種各個(gè)成員仍然滿足對(duì)齊的要求，f成員后面需要填充一定數(shù)量的字節(jié)，不難發(fā)現(xiàn)，這個(gè)數(shù)量應(yīng)為3個(gè)，才能保證test1的對(duì)齊。所以test2相對(duì)于test1來(lái)說(shuō)增加了4個(gè)字節(jié)，所以test2的大小為24。

第二種：位段對(duì)齊

復(fù)制代碼代碼如下:

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};

或者

復(fù)制代碼代碼如下:

struct test3
{
unsigned int a:4;
int b:4;
char c;
};

在windows平臺(tái)，microsoft編譯器下：

相鄰的多個(gè)同類型的數(shù)(帶符號(hào)的與不帶符號(hào)的，只要基本類型相同，也為相同的數(shù)),如果他們占用的位數(shù)不超過(guò)基本類型的大小，那么他們可作為一個(gè)整體來(lái)看待。不同類型的數(shù)要遵循各自的對(duì)齊方式。
如：test3中，a、b可作為一個(gè)整體，他們作為一個(gè)int型數(shù)據(jù)來(lái)看待，所以test3的大小為8字節(jié)。并且a與b的值在內(nèi)存中從低位開(kāi)始依次排列，位于4字節(jié)區(qū)域中的前0-3位和4-7位

如果test4位以下格式

復(fù)制代碼代碼如下:

struct test4
{
unsigned int a:30;
unsigned int b:4;
char c;
};

那么test4的大小就為12個(gè)字節(jié)，并且a與b的值分別分布在第一個(gè)4字節(jié)的前30位，和第二個(gè)4字節(jié)的前4位。

如過(guò)test5是以下形式

復(fù)制代碼代碼如下:

struct test5
{
unsigned int a:4;
unsigned char b:4;
char c;
};

那么由于int和char不同類型，他們分別以各自的方式對(duì)齊，所以test5的大小應(yīng)為8字節(jié)，a與b的值分別位于第一個(gè)4字節(jié)的前4位和第5個(gè)字節(jié)的前4位。

在linux平臺(tái)，gcc編譯器下：

復(fù)制代碼代碼如下:

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};

gcc下，相鄰各成員，不管類型是否相同，占的位數(shù)之和超過(guò)這些成員中第一個(gè)的大小的時(shí)候，在結(jié)構(gòu)中以k值為1對(duì)齊，在結(jié)構(gòu)外k值為其基本類型的值。不超過(guò)的情況下在內(nèi)存中依次排列。
如test3，其大小為4。a，b的值在內(nèi)存中依次排列分別為第一個(gè)四字節(jié)中的0-3和4-7位。

如果test4位以下格式

復(fù)制代碼代碼如下:

struct test4
{
unsigned int a:20;
unsigned char b:4;
char c;
};

test4的大小為4個(gè)字節(jié)，并且a與b的值分別分布在第一個(gè)4字節(jié)的0-19位，和20-23位，c存放在第4個(gè)字節(jié)中。
如過(guò)test5是以下形式

復(fù)制代碼代碼如下:

struct test5
{
unsigned int a:10;
unsigned char b:4;
short c;
};

那么test5的大小應(yīng)為4字節(jié)，a，b的值為0-9位和10-13位。c存放在后兩個(gè)字節(jié)中。如果a的大小變成了20
那么test5的大小應(yīng)為8字節(jié)。即

復(fù)制代碼代碼如下:

struct test6
{
unsigned int a:20;
unsigned char b:4;
short c;
};

此時(shí)，test6的a、b共占用0，1，2共3字節(jié)，c的k值為2，其實(shí)可以4位首位置，但是在結(jié)構(gòu)外，a要以int的方式對(duì)齊。也就是說(shuō)連續(xù)兩個(gè)test6對(duì)象在內(nèi)存中存放的話，a的首位置要保證為4的倍數(shù)，那么c后面必須多填充2位。所以test6的大小為8個(gè)字節(jié)。

關(guān)于位段結(jié)構(gòu)的部分是比較復(fù)雜的。暫時(shí)我就知道這么多。

您可能感興趣的文章: