C語言深入分析浮點型數(shù)據(jù)存儲
1. 前言
上篇文章,我們對整形是如何存儲的做出了講解,而在本篇文章中,我將講解浮點型是如何存儲的,以及對于浮點型數(shù)據(jù)之間的比較做出一個探究,相信在閱讀本篇文章后,你會對數(shù)據(jù)在內(nèi)存中的存儲有一個新的認(rèn)識。話不多說,我們進(jìn)入正題。
2. 浮點型在內(nèi)存中的存儲
浮點數(shù)包括float(單精度浮點數(shù))、double(雙精度浮點數(shù))、long double類型。
常見的浮點數(shù)有:
3.14
1E10//1.0 * (10 ^ 10)
而浮點數(shù)的取值范圍的相關(guān)信息也在float.h
中定義。
例如:
注:DBL_EPSILON和FLT_EPSILON分別是雙精度浮點數(shù)和單精度浮點數(shù)的精度。
了解基本概念之后,我們再看一個關(guān)于浮點型存儲的經(jīng)典樣例。
3. 例題引入
下列程序輸出的結(jié)果是什么?
int main() { int n = 9; float* pFloat = (float*)&n; printf("n的值為:%d\n", n);//9 printf("*pFloat的值為:%f\n", *pFloat);//0.000000 *pFloat = 9.0; printf("num的值為:%d\n", n);//1091567616 printf("*pFloat的值為:%f\n", *pFloat);//9.000000 return 0; }
按照我們平常的思路,結(jié)果也許為:9,9.0,9,9.0,因為存進(jìn)去什么樣拿出來就應(yīng)該是什么樣,對于浮點型只要加上小數(shù)點后六位就好了,但是結(jié)果真的是這樣嗎?讓我們運行一下:
發(fā)現(xiàn)結(jié)果和我們的想法大相庭徑,那么說明浮點型和整形在內(nèi)存中的存儲方式是不同的!
接下來讓我們了解一下浮點型的存儲規(guī)則!
4. 浮點數(shù)存儲規(guī)則
根據(jù)國際標(biāo)準(zhǔn)IEEE 754,任意一個二進(jìn)制浮點數(shù)可以表示成下面的形式:
- (-1)^S * M * 2^E
- (-1)^S表示符號位,當(dāng)S=0,V為正數(shù);當(dāng)S=1,V為負(fù)數(shù)。
- M表示有效數(shù)字,大于等于1,小于2。
- 2^E表示指數(shù)位。
4.1 浮點數(shù)的存
舉個栗子:
5.5
二進(jìn)制表示:101.1
解釋:(1*2^2 + 0*2^1 + 1*2^0).(1*2^(-1))
開始轉(zhuǎn)化:
101.1表示一個整數(shù),所以S = 0;
而二進(jìn)制需要轉(zhuǎn)化成如下形式表示M:101.1 ->1.011;M >= 1 && M < 2
由于小數(shù)點向左移動兩位,所以指數(shù)位E為2;
表示結(jié)果:(-1)^0*1.011*2^2
S M E
通過如上步驟,5.5就正確按照規(guī)則存到了內(nèi)存中!
我們在觀察一下S E M
在內(nèi)存中是如何劃分的:
32位浮點數(shù):
對于32位浮點數(shù),最高位的1位是符號位S,接著的8位是指數(shù)E,剩下的23位為有效數(shù)字M。
64位浮點數(shù):
對于64位的浮點數(shù),最高的1位是符號位S,接著的11位是指數(shù)E,剩下的52位為有效數(shù)字M。
IEEE 754的特殊規(guī)定:
有效數(shù)字M:
前面說過, 1≤M<2 ,也就是說,M可以寫成1.xxxxxx 的形式,其中xxxxxx表示小數(shù)部分。
IEEE 754規(guī)定,在計算機(jī)內(nèi)部保存M時,默認(rèn)這個數(shù)的第一位總是1,因此可以被舍去,只保存后面的xxxxxx部分。
比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節(jié)省1位有效數(shù)字。以32位浮點數(shù)為例,留給M只有23位,
將第一位的1舍去以后,等于可以保存24位有效數(shù)字。
指數(shù)E:
至于指數(shù)E,情況就比較復(fù)雜。
首先,E為一個無符號整數(shù),這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。
但是,我們知道,科學(xué)計數(shù)法中的E是可以出現(xiàn)負(fù)數(shù)的,所以IEEE 754規(guī)定,存入內(nèi)存時E的真實值必須再加上一個中間數(shù),對于8位的E,這個中間數(shù)是127;對于11位的E,這個中間數(shù)是1023。
比如,2^10的E是10,所以保存成32位浮點數(shù)時,必須保存成10+127=137,即10001001。
4.2 浮點數(shù)的取
了解了浮點數(shù)的存儲,那么它將數(shù)據(jù)取出又是什么樣的呢?
指數(shù)E從內(nèi)存中取出可以分成三種情況:
E不全為0或不全為1:
這時,浮點數(shù)就采用下面的規(guī)則表示,即指數(shù)E的計算值減去12(或1023),得到真實值,再將有效數(shù)字M前加上第一位的1。
比如:
0.5(1/2)的二進(jìn)制形式為0.1
,由于規(guī)定正數(shù)部分必須為1,即將小數(shù)點右移1位,則為1.0*2^(-1)
,在內(nèi)存中為-1+127=126,表示為01111110,而尾數(shù)1.0去掉整數(shù)部分為0,補(bǔ)齊0到23位00000000000000000000000,
則其二進(jìn)制表示形式為:0 01111110 00000000000000000000000
E全為0:
這時,浮點數(shù)的指數(shù)E等于1-127(或者1-1023)即為真實值,
有效數(shù)字M不再加上第一位的1,而是還原為0.xxxxxx的小數(shù)。這樣做是為了表示±0,以及接近于0的很小的數(shù)字。
比如:
0.000000001 * 2 ^(-126),這是不是一個極小的數(shù)字,幾乎接近于0(正負(fù)取決于符號位s)。
E全為1:
這時,若有效數(shù)字M全為0(0/1 11111111 00000000000000000000000),表示±無窮大。
若有效數(shù)字M不全為0,則表示有效數(shù)據(jù),是一個非常大的值。
5. 例題解答
int main() { int n = 9; //補(bǔ)碼:0000 0000 0000 0000 0000 0000 0000 1001 float* pFloat = (float*)&n; //浮點型存儲:0 00000000 00000000000000000001001 //E為全零,E = 1 - 127 = -126 //M不再加上1,M = 0.00000000000000000001001 //正數(shù),S = 0 //(-1)^0 * 0.00000000000000000001001 * 2^(-126) //幾乎為0 printf("n的值為:%d\n", n);//存儲為整形,取出來也是按照整形的方式取:9 printf("*pFloat的值為:%f\n", *pFloat);//0.000000 *pFloat = 9.0; //二進(jìn)制表示:1001.0 //小數(shù)點右移三位:1.001 * 2 ^ 3 //S = 0 //M = 1.001 //E = 3 (-1)^0 * 1.001 * 2^3 //浮點型存儲:0 01000010 00100000000000000000000 printf("num的值為:%d\n", n);//1091567616 //認(rèn)為內(nèi)存中放的是有符號整數(shù),符號位為0,正數(shù) //認(rèn)為二進(jìn)制序列就是它的原碼 printf("*pFloat的值為:%f\n", *pFloat);//存儲為浮點型,取出來也是按照浮點型的方式?。?.000000 return 0; }
至此,浮點型的存儲方式,你明白了嗎?
6. 浮點型的精度探究(※)
此部分為浮點型存儲的拓展部分,內(nèi)容為對浮點型數(shù)據(jù)之間的比較和浮點型精度的講解,由于這部分內(nèi)容在實際學(xué)習(xí)時很少提及,故歸為拓展部分,有興趣的話可以了解一下。
(由于浮點數(shù)默認(rèn)是double類型,使用float可能會出現(xiàn)告警,考慮到方便起見和double精度更高,所以以下內(nèi)容均使用double類型)
6.1 浮點數(shù)的精度丟失
我們了解了浮點數(shù)的存儲方式之后,發(fā)現(xiàn)浮點數(shù)在存儲時有時是無法精確保存的,是可能會有精度損失的,注意這里的損失,不是一味的減少了,還有可能增多。浮點數(shù)本身存儲的時候,在計算不盡的時候,會采用“四舍五入”或者其他策略。
樣例:
int main() { double x = 3.6; printf("%.50lf\n", x); return 0; }
運行結(jié)果:
6.2 浮點數(shù)之間如何比較
上述例子意味著,浮點數(shù)存入時數(shù)據(jù)會不一樣,這是否說明浮點數(shù)之間無法正常比較?事實勝于雄辯,接著探究:
int main() { double x = 1.0; double y = 0.1; printf("%.50lf\n", x - 0.9); printf("%.50lf\n", y); if ((x - 0.9) == 0.1) { printf("=="); } else { printf("!="); } return 0; }
運行結(jié)果:
我們觀察結(jié)果,發(fā)現(xiàn)不僅存儲的內(nèi)容發(fā)生了變化,而且直接用==
相比較得出的結(jié)果也是不等于,那么浮點數(shù)之間是如何比較的?應(yīng)該如何理解?
C語言中浮點數(shù)應(yīng)該進(jìn)行范圍精度比較?。。?/p>
如圖:兩個浮點數(shù)只要進(jìn)行比較時,它們的差值,只需要在-EPS ~ EPS
的精度范圍內(nèi),那么便認(rèn)定兩個數(shù)相等?。?!
同樣的,條件也可以寫成絕對值的形式:fabs((x - y) < EPSLION)
。fabs是一個庫函數(shù),計算變量的絕對值,相關(guān)頭文件為#include<math.h>
。
這里的EPSILON是精度,精度分為系統(tǒng)提供的精度(float.h中定義)和自定義的精度:
自定義的精度:
#define EPS 0.00000000000001//自定義的精度,名字,數(shù)值可以自定義
系統(tǒng)提供的精度:
#define DBL_EPSILON//系統(tǒng)提供的精度,需要引頭文件 #include<float.h>
轉(zhuǎn)到定義觀察一下:
這個數(shù)小到什么程度呢?1.0雖然加很多數(shù)據(jù)都不等于1.0,但是這個DBL_EPSILON
是最小的。
使用精度后,再進(jìn)行比較:
//#define EPS 0.00000000000001//自定義方案 #define DBL_EPSILON//系統(tǒng)提供的精度,是一個非常小的值 #include<stdio.h> #include<float.h> #include<math.h> int main() { double x = 1.0; double y = 0.1; printf("%.50lf\n", x - 0.9); printf("%.50lf\n", y); //if (fabs((x - 0.9) - y) < EPS)//自定義 if (fabs((x - 0.9) - y) < DBL_EPSILON)//系統(tǒng) { printf("==\n"); } else { printf("!=\n"); } return 0; }
運行結(jié)果:
6.3 浮點數(shù)和0比較
對于兩個浮點數(shù)之間比較寫做x - y
的形式,那么對于浮點數(shù)和0比較就為x - 0
,直接寫做x即可。
樣例:
#include<float.h> #include<stdio.h> #include<math.h> int main() { double x = 0.0; if (fabs(x) < DBL_EPSILON)//fabs(x - 0) //if(x > -DBL_EPSILON && x < DBL_EPSILON) { printf("yes\n");//一個浮點數(shù)和0比較,只要保證它的絕對值在精度范圍內(nèi)就相等 } return 0; }
運行結(jié)果:
但是,浮點數(shù)和零值比較要不要相等?x >= -DBL_EPSILON && x <= DBL_EPSILON)
(fab(x) <= DBL_EPSILON
)?
精度是引起x變化的最小值,但是精度 + x依舊能引起精度變化;
如果寫成fab(x) <= DBL_EPSILON;也就是fab(x) == DBL_EPSILON的形式,這時x就是精度;
double y + x != y;也就是加上x(精度)會引起變化,相當(dāng)于double y + DBL_EPSILON != y;
但是y + 0.0 == y,y加上零值時,值是不會變的!?。?/p>
因為精度本身就會引起值的變化,只是很小而已,就不符合0的概念;
寫法比較矛盾,不建議寫上等號!?。?/p>
所以,浮點數(shù)和零值進(jìn)行比較,只要保證浮點數(shù)的絕對值在精度范圍內(nèi),就判定浮點數(shù)和零值相等,且比較時,不建議加上等號。
7. 結(jié)語
到這里本篇博客到此結(jié)束,相信通過這兩篇文章,大家也可以對數(shù)據(jù)在內(nèi)存中的存儲有了一定的認(rèn)識,雖然這些知識并不會對編程能力有很大的提高,但是能擴(kuò)大我們看待問題的視角,也算修煉了"內(nèi)功"。
到此這篇關(guān)于C語言深入分析浮點型數(shù)據(jù)存儲的文章就介紹到這了,更多相關(guān)C語言數(shù)據(jù)存儲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++如何判斷一個數(shù)字是否為質(zhì)數(shù)
這篇文章主要為大家詳細(xì)介紹了C++如何判斷一個數(shù)字是否為質(zhì)數(shù),具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03標(biāo)準(zhǔn)CSV格式的介紹和分析以及解析算法實例詳解
這篇文章主要介紹了標(biāo)準(zhǔn)CSV格式的介紹和分析以及解析算法實例詳解的相關(guān)資料,需要的朋友可以參考下2016-12-12