C/C++讀取大文件數(shù)據(jù)方式詳細(xì)講解
前言
以前對(duì)C語(yǔ)言與C++不夠了解時(shí),我無(wú)法知道如何完整獲取一個(gè)文件的所有數(shù)據(jù)并且不遺漏掉。
在網(wǎng)絡(luò)上也搜索了很多很多的相關(guān)帖子,但是沒(méi)有一個(gè)是真正有用的。
本文章使用C語(yǔ)言進(jìn)行演示,如需使用C++的話原理為一樣的。
以下列出那些沒(méi)用的代碼
第一種方法
// 創(chuàng)建一個(gè)變量,然后使用FILE指針打開一個(gè)文件 // 用fgetc函數(shù)與循環(huán)代碼不斷將數(shù)據(jù)讀取到變量中 uint8_t data[4096]; FILE *fp = fopen("文件路徑", "rb"); for(int x = 0; x < 4096; ++x) { data[x] = fgetc(fp); }
這種方法的弊端是什么呢?
- 在不知道文件大小的情況下盲目直接讀取可能會(huì)產(chǎn)生各種意想不到的情況。
- 就算知道文件大小,你難不成要每個(gè)文件都先看一眼大小?
- 代碼量比較多且不易維護(hù)。
第二種方法
// 這個(gè)可以說(shuō)也是我見到最多的方法了 // 但是這個(gè)方法真的很蠢,真的很蠢。 uint8_t data[4096]; uint8_t temp; FILE *fp = fopen("文件路徑", "rb"); int x = 0; while((temp = fgetc(fp)) != EOF) { data[x] = temp; x++; }
這種方法的好處比第一種要多,但是依舊很蠢。
- 可以通過(guò)EOF判斷文件是否被“讀取完畢”
- 不至于讓指針像第一個(gè)那樣亂來(lái)
壞處也很明顯,此方法使用EOF而不是真正的文件終止符。
那么你在讀取jpg或jpeg格式的圖片文件時(shí),你就會(huì)明白為什么這個(gè)方法蠢了。
第三種方法
// 這種方法類似于第一種方法 char data[4096]; FILE *fp = fopen("1.txt", "rb"); data = fgets(data, 文件大小, fp);
這個(gè)方法可以說(shuō)是最沒(méi)用的,因?yàn)樗荒茏x取ASCII字符
大于0x7f 小于等于 0xff的數(shù)據(jù)都無(wú)法讀取。
解決
// 使用fread函數(shù)與fwrite函數(shù)對(duì)文件進(jìn)行操作 // 使用feof文件終止符判斷文件是否已經(jīng)讀取完畢。 // 同時(shí)可以使用文件的偏移指針確定文件大小來(lái)決定變量該為多大 FILE *fp = fopen("image_1.jpg", "rb"); uint8_t *data = (uint8_t *)malloc(4096); size_t fileSize; while(!feof(fp)) { fileSize = fread(data, 1, 4096, fp); }
這樣便可以絕對(duì)確保文件被完整讀取。
當(dāng)然你可能會(huì)說(shuō)這也沒(méi)有把文件直接一次性讀完???
那接下來(lái)我說(shuō)的你就聽好。
- 先通過(guò)文件指針來(lái)獲取文件的大小(Windows端請(qǐng)使用64位的函數(shù))
- 創(chuàng)建一個(gè)指針,指向無(wú)符號(hào)字符類型,使用的內(nèi)存大小為文件大小
- 使用fread函數(shù)一次性讀取(電腦配置不高的可能會(huì)出現(xiàn)假死)
- 讀取完畢之后,文件就被你一次性完全讀取了。
- 請(qǐng)注意你的內(nèi)存情況以及磁盤空間情況,否則可能會(huì)出大問(wèn)題。
到此這篇關(guān)于C/C++讀取大文件數(shù)據(jù)方式詳細(xì)講解的文章就介紹到這了,更多相關(guān)C++讀取大文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Qt基礎(chǔ)開發(fā)之Qt多線程類QThread與Qt定時(shí)器類QTimer的詳細(xì)方法與實(shí)例
這篇文章主要介紹了Qt基礎(chǔ)開發(fā)之Qt多線程類QThread與Qt定時(shí)器類QTimer的詳細(xì)方法與實(shí)例,需要的朋友可以參考下2020-03-03C++?MiniZip實(shí)現(xiàn)目錄壓縮與解壓的示例詳解
Zlib是一個(gè)開源的數(shù)據(jù)壓縮庫(kù),提供了一種通用的數(shù)據(jù)壓縮和解壓縮算法,本文主要為大家詳細(xì)介紹了如何利用Zlib實(shí)現(xiàn)目錄壓縮與解壓,需要的小伙伴可以參考下2023-11-11C++標(biāo)準(zhǔn)模板庫(kù)函數(shù)sort的那些事兒
sort函數(shù)是標(biāo)準(zhǔn)模板庫(kù)的函數(shù),已知開始和結(jié)束的地址即可進(jìn)行排序,可以用于比較任何容器(必須滿足隨機(jī)迭代器),任何元素,任何條件,執(zhí)行速度一般比qsort要快2013-09-09C++實(shí)現(xiàn)算法兩個(gè)數(shù)字相加詳解
這篇文章主要介紹了C++實(shí)現(xiàn)算法兩個(gè)數(shù)字相加詳解,本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-07-07