快捷導(dǎo)航

C++中的數(shù)據(jù)對(duì)齊示例詳解

更新時(shí)間：2021年03月15日 09:56:17 作者：老胡寫代碼

這篇文章主要介紹了C++中數(shù)據(jù)對(duì)齊的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

前言

對(duì)于C/C++程序員來說，掌握數(shù)據(jù)對(duì)齊是很有必要的，因?yàn)橹挥辛私饬诉@個(gè)概念，才能知道編譯器在什么時(shí)候會(huì)偷偷的塞入一些字節(jié)（padding）到我們的結(jié)構(gòu)體（struct/class），也唯有這樣我們才能更好的理解、優(yōu)化結(jié)構(gòu)體和內(nèi)存。

幾個(gè)栗子

看看幾個(gè)簡(jiǎn)單的Struct，能猜出他們的SIZE嗎？（運(yùn)行于64Bit win10 vs2017）

struct A
{
	char c1;
};

struct B
{
	int i1;
};

struct C
{
	char c1;
	int i1;
};

struct D
{
	char c1;
	int i1;
	char c2;
};

struct E
{
	char c1;
	char c2;
	int i1;
};

int main()
{
	std::cout << "A's size is " << sizeof(A) << std::endl;
	std::cout << "B's size is " << sizeof(B) << std::endl;
	std::cout << "C's size is " << sizeof(C) << std::endl;
	std::cout << "D's size is " << sizeof(D) << std::endl;
	std::cout << "E's size is " << sizeof(E) << std::endl;	
}

先揭曉答案

如果對(duì)任何一個(gè)結(jié)構(gòu)體的大小有疑問，那么這篇文章非常適合你，請(qǐng)接著往下看，我們會(huì)解釋數(shù)據(jù)對(duì)齊。

數(shù)據(jù)對(duì)齊

處理器讀取數(shù)據(jù)的行為

在C/C++中，每種數(shù)據(jù)類型都有對(duì)齊的要求（這個(gè)更多是處理器的要求而非語言層面），大家都知道，處理器工作的時(shí)候需要數(shù)據(jù)總線（data bus）、控制總線（control bus）和地址總線（address bus）一起配合工作。而在數(shù)據(jù)總線取數(shù)據(jù)的時(shí)候，處理器為了高效的工作，一次會(huì)取4byte或者8byte數(shù)據(jù)（依系統(tǒng)32bit或者64bit而不同），這就是所謂數(shù)據(jù)字長(zhǎng)（word size）。同時(shí)在讀取內(nèi)存的時(shí)候，也會(huì)從4byte或者8byte邊界開始讀取，這是處理器行為，我們只能尊重不能改變?？紤]下面的例子，

struct F
{
  int i1
  char c1;
  int i2;
  char c2;
};
#include <iostream>

int main()
{
  F f;
  printf("0x%p\n", &f);
}

它的起始地址輸出是：

0x000000FE8BCFFB88

所以在內(nèi)存中可能的排列就是：

讀取數(shù)據(jù)的時(shí)候，每次讀入8btye，8個(gè)字節(jié)為一個(gè)讀取單元，就像蒸籠的一格，這樣做的好處是每次可以盡可能多的讀入數(shù)據(jù)，減少讀取次數(shù)。設(shè)想，如果一次只讀入一個(gè)字節(jié)數(shù)據(jù)，那么一個(gè)Int就需要4次讀取，明顯效率就很低。

編譯器的做法

如果沒有對(duì)齊

了解了處理器如何讀取數(shù)據(jù)的，我們就不難理解編譯器為什么會(huì)做出調(diào)整。試想，如果編譯器不在后臺(tái)做出填充（padding），那么我們就會(huì)遇到這種情況

像這樣的話，訪問i1, c1 都不會(huì)有問題，但是訪問i2就會(huì)發(fā)現(xiàn)，數(shù)據(jù)散落在不同的蒸籠，原本只需要一次讀取就行的數(shù)據(jù)，還需要一次額外的數(shù)據(jù)讀取才行，這就造成了讀取數(shù)據(jù)的低效，在某些嚴(yán)格的CPU，比如ARM上面，這種非對(duì)齊的數(shù)據(jù)讀操作甚至?xí)痪芙^。

編譯器對(duì)齊

所以，為了讓數(shù)據(jù)讀取效率最大化，編譯器會(huì)選擇犧牲一部分空間來換取效率，他們不會(huì)允許i2橫跨兩個(gè)讀取單元。在實(shí)際中，上面的結(jié)構(gòu)體會(huì)是這樣的

可以看出，

為了解決i2的對(duì)齊問題，c1之后填充了3個(gè)空字節(jié)
同時(shí)為了保持整個(gè)結(jié)構(gòu)體的對(duì)齊（結(jié)構(gòu)體對(duì)齊字節(jié)數(shù)等于其最大的數(shù)據(jù)成員的對(duì)齊字節(jié)數(shù)，這里是4），在結(jié)構(gòu)體的尾部還會(huì)有3個(gè)空字節(jié)
整個(gè)結(jié)構(gòu)體的大小就是16字節(jié)，有6個(gè)字節(jié)是空字節(jié)。

所以，在編譯器的作用下，最開始幾個(gè)Struct實(shí)際上擴(kuò)展為，

struct A
{
	char c1; //no padding
};

struct B
{
	int i1; //no padding
};

struct C
{
	char c1;
	char pad[3]; //padding
	int i1;
};

struct D
{
	char c1;
	char pad1[3]; //padding
	int i1;
	char c2;
	char pad2[3]; //padding
};

struct E
{
	char c1;
	char c2;
	char pad[2]; //padding
	int i1;
};

對(duì)齊的目的是要讓數(shù)據(jù)訪問更高效，一般來說，數(shù)據(jù)類型的對(duì)齊要求和它的長(zhǎng)度是一致的，比如，

char 是 1
short 是 2
int 是 4
double 是 8

這不是巧合，比如short，2對(duì)齊保證了short只可能出現(xiàn)在一個(gè)讀取單元的0, 2, 4, 6格，而不會(huì)出現(xiàn)在1, 3, 5, 7格；再比如int，4對(duì)齊保證了一個(gè)讀取單元可以裝載2個(gè)int——在0或者4格。從根本上杜絕了同一個(gè)數(shù)據(jù)橫跨讀取單元的問題。

總結(jié)

可能有人會(huì)疑惑了，知道這些對(duì)我們工作有什么幫助嗎？如果僅僅是比較High-Level的應(yīng)用程序編程，可能確實(shí)感覺不明顯，最多就當(dāng)成一個(gè)知識(shí)點(diǎn)了解一下，但是對(duì)于搞比較底層開發(fā)的，比如游戲引擎，或者是在內(nèi)存環(huán)境很緊張的情況下開發(fā)，比如嵌入式開發(fā)，那了解這個(gè)有助于在某些情況下節(jié)約內(nèi)存。

考慮前面的D和E結(jié)構(gòu)體，他們擁有完全一樣的成員，卻有著不同的結(jié)構(gòu)體大小，就是因?yàn)镋選擇把對(duì)齊要求接近的變量類型放在一起，減小了填充padding的數(shù)量從而達(dá)到了減小結(jié)構(gòu)體大小的目的。

在設(shè)計(jì)結(jié)構(gòu)體的時(shí)候，這個(gè)可以作為一個(gè)考量，有一些函數(shù)可以幫助我們查看某個(gè)類型的對(duì)齊要求，比如Visual Studio中的__alignof函數(shù)。

這就是關(guān)于數(shù)據(jù)對(duì)齊的一些基礎(chǔ)知識(shí)，希望能幫助大家解惑，如果您發(fā)現(xiàn)本文有任何寫的不對(duì)的地方，歡迎留言指出來；如果有其他問題，也歡迎留言一起討論。

到此這篇關(guān)于C++中的數(shù)據(jù)對(duì)齊的文章就介紹到這了,更多相關(guān)C++數(shù)據(jù)對(duì)齊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: