深入解析Nodejs中的大文件讀寫
前言
最近在做一些node端的文件讀寫和分片上傳工作,在這個(gè)過程中,發(fā)現(xiàn)node讀取的文件如果超過2G,超過了讀取Blob最大值,會(huì)出現(xiàn)讀取異常,此外在node中讀寫文件也受服務(wù)器RAM的限制等,需要分片讀取,本人記錄一下遇到的問題以及解決問題的經(jīng)過。
- node中的文件讀寫
- node文件讀寫RAM和Blob大小的限制
- 其他
一、node中的文件讀寫
1.1 常規(guī)文件讀寫
常規(guī)的,如果我們要讀取一個(gè)比較小的文件,可以直接通過:
const fs = require('fs') let data = fs.readFileSync("./test.png") console.log(data,123) //輸出data = <Buffer 89 50 4e ...>
一般而言,同步的方法不是很推薦,因?yàn)閖s/nodejs是單線程的,同步的方法會(huì)阻塞主線程。最新版的node直接提供了fs.promise,可以結(jié)合async/await直接使用:
const fs = require('fs') const readFileSync = async () => { let data = await fs.promises.readFile("./test.png") console.log(data,123) } readFileSync() //輸出data = <Buffer 89 50 4e ...>
這里通過異步的方法調(diào)用不會(huì)阻塞主線程,多個(gè)文件讀取的IO也可以并行進(jìn)行等。
1.2 Stream文件讀寫
常規(guī)的文件讀寫,我們會(huì)把文件一次性的讀取到內(nèi)存中,這種方法時(shí)間效率和內(nèi)存效率都很低,時(shí)間效率低是指必須要一次性讀取完畢后才能執(zhí)行后續(xù)才做,內(nèi)存效率低是指必須把這個(gè)文件都一次性讀取放入內(nèi)存中,很占用內(nèi)存。
因此這種情況下,我們一般使用Stream來進(jìn)行文件的讀?。?/strong>
const fs = require('fs') const readFileTest = () => { var data = '' var rs = fs.createReadStream('./test.png'); rs.on('data', function(chunk) { data += chunk; console.log(chunk) }); rs.on('end',function(){ console.log(data); }); rs.on('error', function(err){ console.log(err.stack); }); } readFileTest() // data = <Buffer 89 50 64 ...>
通過Steam來進(jìn)行文件讀寫,可以提高內(nèi)存效率和時(shí)間效率。
- 內(nèi)存效率:在處理數(shù)據(jù)之前,不需要在內(nèi)存中加載大量(或整個(gè))數(shù)據(jù)
- 時(shí)間效率:一旦有了數(shù)據(jù),就可以開始處理,這大大減少開始處理數(shù)據(jù)的時(shí)間,而不必等到整個(gè)數(shù)據(jù)加載完畢再進(jìn)行處理。
Stream的文件還支持第二種寫法:
const fs = require('fs') const readFileTest = () => { var data = '' var chunk; var rs = fs.createReadStream('./test.png'); rs.on('readable', function() { while ((chunk=rs.read()) != null) { data += chunk; }}); rs.on('end', function() { console.log(data) }); }; readFileTest()
二、node文件讀寫RAM和Blob大小的限制
2.1 基礎(chǔ)問題
在讀取大文件時(shí),會(huì)有讀取文件大小的限制,比如我們現(xiàn)在在讀取一個(gè)2.5G的視頻文件:
const fs = require('fs') const readFileTest = async () => { let data = await fs.promises.readFile("./video.mp4") console.log(data) } readFileTest()
執(zhí)行上述的代碼會(huì)報(bào)錯(cuò):
RangeError [ERR_FS_FILE_TOO_LARGE]: File size (2246121911) is greater than 2 GB
我們可能會(huì)想到,通過設(shè)置option,NODE_OPTIONS='--max-old-space-size=5000',此時(shí)5000M>2.5G,但是報(bào)錯(cuò)還是沒有消失,也就是說通過Options無法改變node讀取文件的大小限制。
上述是常規(guī)的方式讀取大文件,如果通過Steam的方式讀取還會(huì)有文件大小的限制嘛? 比如:
const fs = require('fs') const readFileTest = () => { var data = '' var rs = fs.createReadStream('./video.mp4'); rs.on('data', function(chunk) { data += chunk; }); rs.on('end',function(){ console.log(data); }); rs.on('error', function(err){ console.log(err.stack); }); } readFileTest()
如上方式讀取一個(gè)2.5G的文件不會(huì)有異常,不過要注意的是這邊有一個(gè)報(bào)錯(cuò):
data += chunk;
^
RangeError: Invalid string length
此時(shí)是因?yàn)閐ata的長(zhǎng)度超過了最大限制,比如2048M等。因此在用Steam處理的時(shí)候,在對(duì)讀取結(jié)果的保存時(shí),要注意文件的大小,千萬(wàn)不能超過默認(rèn)的Buffer的最大值。上述這種情況,我們不用data += chunk將數(shù)據(jù)全部保存在一個(gè)大的data中,我們可以邊讀取邊處理。
2.2 分片讀取
createReadStream在讀取文件的過程中,其實(shí)也可以分段讀取,這種分段讀取的方法也可以做為大文件讀取的備選項(xiàng)。特別是在并發(fā)讀取的時(shí)候有一定的優(yōu)點(diǎn),可以提升文件讀取和處理的速度。
createReadStream接受第二個(gè)參數(shù){start,end}。我們可以通過fs.promises.stat來獲取文件的大小,然后確定分片,最后分片一次讀取,比如:
- 獲取文件大小
const info = await fs.promises.stat(filepath) const size = info.size
- 按照指定的SIZE分片(比如128M一個(gè)分片)
const SIZE = 128 * 1024 * 1024 let sizeLen = Math.floor(size/SIZE) let total = sizeLen +1 ; for(let i=0;i<=sizeLen;i++){ if(sizeLen ===i){ console.log(i*SIZE,size,total,123) readStremfunc(i*SIZE,size,total) }else{ console.log(i*SIZE,(i+1)*SIZE,total,456) readStremfunc(i*SIZE,(i+1)*SIZE-1,total) } } //分片后【0,128M】,【128M, 256M】...
3.實(shí)現(xiàn)讀取函數(shù)
const readStremfunc = () => { const readStream = fs.createReadStream(filepath,{start:start,end:end}) readStream.setEncoding('binary') let data = '' readStream.on('data', chunk => { data = data + chunk }) readStream.end('data', () => { ... }) }
值得注意的是fs.createReadStream(filepath,{start,end}),start和end是前閉后閉的,比如fs.createReadSteam(filepath,{start:0,end:1023})讀取的是[0,1023]一共1024個(gè)bit。
三、其他
3.1 擴(kuò)展瀏覽器端的大文件讀寫、
前面將了大文件在nodejs中的讀取,那么在瀏覽器端會(huì)讀取大文件會(huì)有什么問題嗎?
瀏覽器在本地讀取大文件時(shí),之前有類似FileSaver、StreamSaver等方案,不過在瀏覽器本身添加了File的規(guī)范,使得瀏覽器本身就默認(rèn)和優(yōu)化了Stream的讀取。我們不需要做額外的工作,不過不同的版本會(huì)有兼容性的問題,我們還是可以通過FileSaver等進(jìn)行兼容。
3.2 請(qǐng)求靜態(tài)資源大文件
如果是在瀏覽器中獲取靜態(tài)資源大文件,一般情況下只需要通過range分配請(qǐng)求即可,一般的CDN加速域名,不管是阿里云還是騰訊云,對(duì)于分片請(qǐng)求都支持的很好,我們可以將資源通過cdn加速,然后在瀏覽器端直接請(qǐng)求cdn加速有的資源。
分片獲取cdn靜態(tài)資源大文件的步驟為,首先通過head請(qǐng)求獲取文件大?。?/strong>
const getHeaderInfo = async (url: string) => { const res: any = await axios.head(url + `?${Math.random()}`); return res?.headers; }; const header = getHeaderInfo(source_url) const size = header['content-length']
我們可以從header中的content-length屬性中,獲取文件的大小。
然后進(jìn)行分片和分段,最后發(fā)起range請(qǐng)求:
const getRangeInfo = async (url: string, start: number, end: number) => { const data = await axios({ method: 'get', url, headers: { range: `bytes=${start}-${end}`, }, responseType: 'blob', }); return data?.data; };
在headers中指定 range: bytes=${start}-${end}
,就可以發(fā)起分片請(qǐng)求去獲取分段資源,這里的start和end也是前閉后閉的。
到此這篇關(guān)于深入解析Nodejs中的大文件讀寫的文章就介紹到這了,更多相關(guān)Nodejs大文件讀寫內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- nodejs實(shí)現(xiàn)大文件(在線視頻)的讀取
- Nodejs excel(.xlsx) 文件的讀寫方式
- NodeJS后端開發(fā)操作文件之讀寫文件
- 使用nodeJS中的fs模塊對(duì)文件及目錄進(jìn)行讀寫,刪除,追加,等操作詳解
- nodejs創(chuàng)建簡(jiǎn)易web服務(wù)器與文件讀寫的實(shí)例
- Nodejs讀取文件時(shí)相對(duì)路徑的正確寫法(使用fs模塊)
- nodejs讀寫json文件的簡(jiǎn)單方法(必看)
- 詳解nodeJS中讀寫文件方法的區(qū)別
- 使用nodejs、Python寫的一個(gè)簡(jiǎn)易HTTP靜態(tài)文件服務(wù)器
相關(guān)文章
npm安裝報(bào)錯(cuò)npm ERR! Error: EPERM: operation&
這篇文章主要為大家介紹了npm安裝報(bào)錯(cuò)npm ERR! Error: EPERM: operation not permitted解決,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-07-07利用n 升級(jí)工具升級(jí)Node.js版本及在mac環(huán)境下的坑
這篇文章主要介紹了利用n 升級(jí)工具升級(jí)Node.js的方法,以及通過網(wǎng)友的測(cè)試發(fā)現(xiàn)在mac環(huán)境下利用n工具升級(jí)不成功導(dǎo)致node.js不可用的解決方法,有需要的朋友可以參考借鑒,下面來一起看看吧。2017-02-02如何將Node.js中的回調(diào)轉(zhuǎn)換為Promise
這篇文章主要給大家介紹了關(guān)于如何將Node.js中的回調(diào)轉(zhuǎn)換為Promise的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11在CentOS 7服務(wù)器上安裝Node.js的方法步驟
Node.js 是一個(gè)用于服務(wù)器端編程的 JavaScript 平臺(tái),允許用戶快速構(gòu)建網(wǎng)絡(luò)應(yīng)用程序,通過在前端和后端都使用 JavaScript,開發(fā)可以更加一致并且可以在同一個(gè)系統(tǒng)中設(shè)計(jì),在本指南中,我們將向您展示如何在 Ubuntu 14.04 服務(wù)器上開始使用 Node.js2024-09-09node.js將MongoDB數(shù)據(jù)同步到MySQL的步驟
這篇文章主要給大家介紹了關(guān)于node.js將MongoDB數(shù)據(jù)同步到MySQL的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧。2017-12-12Node.js利用斷言模塊assert進(jìn)行單元測(cè)試的方法
最近在用Node寫一個(gè)實(shí)時(shí)聊天小應(yīng)用,其中就用到了單元測(cè)試,所以死下面這篇文章主要給大家介紹了關(guān)于Node.js利用斷言模塊assert進(jìn)行單元測(cè)試的方法,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考借鑒,下面來一起看看吧。2017-09-09Node.js讀寫文件之批量替換圖片的實(shí)現(xiàn)方法
下面小編就為大家?guī)硪黄狽ode.js讀寫文件之批量替換圖片的實(shí)現(xiàn)方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2016-09-09node+axios實(shí)現(xiàn)服務(wù)端文件上傳示例
這篇文章主要介紹了node+axios實(shí)現(xiàn)服務(wù)端文件上傳示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06