快捷導(dǎo)航

如何使用Node寫(xiě)靜態(tài)文件服務(wù)器

更新時(shí)間：2022年09月19日 08:41:38 作者：進(jìn)擊的大蔥

這篇文章主要介紹了如何使用Node寫(xiě)靜態(tài)文件服務(wù)器，文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹，具有一定的參考價(jià)值，感興趣的小伙伴可以參考一下

背景

作為前端工程師，我想大家一定對(duì)靜態(tài)文件服務(wù)器不會(huì)陌生。所謂的靜態(tài)文件服務(wù)器做的工作就是將我們的前端靜態(tài)文件(.js/.css/.html)傳輸給瀏覽器，然后瀏覽器再將我們的頁(yè)面渲染出來(lái)。我們常用的webpack-dev-server就是本地開(kāi)發(fā)用的靜態(tài)文件服務(wù)器，而一般線上環(huán)境我們會(huì)使用nginx，因?yàn)樗臃€(wěn)定和高效。既然靜態(tài)文件服務(wù)器無(wú)處不在，那么它們又是如何實(shí)現(xiàn)的呢？本篇文章將帶你手把手實(shí)現(xiàn)一個(gè)高效的靜態(tài)文件服務(wù)器。

功能介紹

我們的靜態(tài)服務(wù)器包括下面兩個(gè)功能:

當(dāng)用戶請(qǐng)求的內(nèi)容是文件夾時(shí)，展示當(dāng)前文件夾的結(jié)構(gòu)信息
當(dāng)用戶請(qǐng)求的內(nèi)容是文件時(shí)，返回文件的內(nèi)容

我們來(lái)看一下實(shí)際效果，服務(wù)端的靜態(tài)文件目錄是這樣的:

static
└── index.html

訪問(wèn)localhost:8080可以獲取根目錄的信息:

請(qǐng)求根文件夾

在根目錄下只有一個(gè)index.html文件。我們點(diǎn)擊index.html文件可以獲取這個(gè)文件的具體內(nèi)容:

index.html

代碼實(shí)現(xiàn)

根據(jù)上面的需求描述，我們先用流程圖來(lái)設(shè)計(jì)一下我們的邏輯如何實(shí)現(xiàn):

邏輯設(shè)計(jì)流程圖

其實(shí)靜態(tài)文件服務(wù)器的實(shí)現(xiàn)思路還是很簡(jiǎn)單的：先判斷資源存不存在，不存在就直接報(bào)錯(cuò)，資源存在的話根據(jù)資源的類型返回對(duì)應(yīng)的結(jié)果給客戶端就可以了。

基礎(chǔ)代碼實(shí)現(xiàn)

看完上面的流程圖，我相信大家的思路基本清晰了，接著我們看一下具體的代碼實(shí)現(xiàn):

const http = require('http')
const url = require('url')
const fs = require('fs')
const path = require('path')
const process = require('process')

// 獲取服務(wù)端的工作目錄，也就是代碼運(yùn)行的目錄
const ROOT_DIR = process.cwd()

const server = http.createServer(async (req, resp) => {
  const parsedUrl = url.parse(req.url)
  // 刪除開(kāi)頭的'/'來(lái)獲取資源的相對(duì)路徑，e.g: `/static`變?yōu)閌static`
  const parsedPathname = parsedUrl.pathname.slice(1)
  // 獲取資源在服務(wù)端的絕對(duì)路徑
  const pathname = path.resolve(ROOT_DIR, parsedPathname)

  try {
    // 讀取資源的信息, fs.Stats對(duì)象
    const stat = await fs.promises.stat(pathname)

    if (stat.isFile()) {
      // 如果請(qǐng)求的資源是文件就交給sendFile函數(shù)處理
      sendFile(resp, pathname)
    } else {
      // 如果請(qǐng)求的資源是文件夾就交給sendDirectory函數(shù)處理
      sendDirectory(resp, pathname)
    }
  } catch (error) {
    // 訪問(wèn)的資源不存在
    if (error.code === 'ENOENT') {
      resp.statusCode = 404
      resp.end('file/directory does not exist')
    } else {
      resp.statusCode = 500
      resp.end('something wrong with the server')
    }
  }
})

server.listen(8080, () => {
  console.log('server is up and running')
})

在上面的代碼中我使用http模塊創(chuàng)建了一個(gè)server實(shí)例，這個(gè)實(shí)例里面定義了處理所有HTTP請(qǐng)求的handler函數(shù)。handler函數(shù)實(shí)現(xiàn)比較簡(jiǎn)單，讀者根據(jù)上面的代碼注釋就可以看明白了，這里想要說(shuō)明一下我為什么使用fs.promises.stat來(lái)獲取資源的元信息(fs.Stats類，包括資源的類型和更改時(shí)間等)而不使用可以實(shí)現(xiàn)同一個(gè)功能的fs.stat和fs.statSync:

fs.promises.stat vs fs.stat: fs.promises.stat是promise-style的，可以使用async和await來(lái)實(shí)現(xiàn)異步的邏輯，代碼很干凈。而fs.stat是callback-style的，這種API寫(xiě)異步邏輯最后可能會(huì)變成意大利面條，后期維護(hù)困難。
fs.promises.stat vs fs.statSync: fs.promises.stat讀取文件的信息是一個(gè)異步操作，不會(huì)阻塞主線程的執(zhí)行。而fs.statSync是同步的，這也就意味著當(dāng)這個(gè)API執(zhí)行的時(shí)候，JS主線程會(huì)卡死，其它的資源請(qǐng)求是處理不了的。這里我也建議當(dāng)大家需要在服務(wù)端進(jìn)行文件系統(tǒng)的讀寫(xiě)的時(shí)候，一定要優(yōu)先使用異步API而避免使用同步式的API。

接著我們來(lái)看一下sendFile和sendDirectory這兩個(gè)函數(shù)的具體實(shí)現(xiàn):

const sendFile = async (resp, pathname) => {
  // 使用promise-style的readFile API異步讀取文件的數(shù)據(jù)，然后返回給客戶端
  const data = await fs.promises.readFile(pathname)
  resp.end(data)
}
const sendDirectory = async (resp, pathname) => {
  // 使用promise-style的readdir API異步讀取文件夾的目錄信息，然后返回給客戶端
  const fileList = await fs.promises.readdir(pathname, { withFileTypes: true })
  // 這里保存一下子資源相對(duì)于根目錄的相對(duì)路徑，用于后面客戶端繼續(xù)訪問(wèn)子資源
  const relativePath = path.relative(ROOT_DIR, pathname)

  // 構(gòu)造返回的html結(jié)構(gòu)體
  let content = '<ul>'
  fileList.forEach(file => {
    content += `
    <li>
      <a href=${
        relativePath
      }/${file.name}>${file.name}${file.isDirectory() ? '/' : ''}
      </a>
    </li>` 
  })

  content += '</ul>'
  // 返回當(dāng)前的目錄結(jié)構(gòu)給客戶端
  resp.end(`<h1>Content of ${relativePath || 'root directory'}:</h1>${content}`)
}

sendDirectory通過(guò)fs.promises.readdir來(lái)獲取其底下的目錄信息，然后以列表的形式返回一個(gè)html結(jié)構(gòu)給客戶端。這里值得一提的是：由于客戶端需要按照返回的子資源信息進(jìn)一步訪問(wèn)子資源，所以我們需要記錄子資源相對(duì)于根目錄的相對(duì)路徑。sendFile函數(shù)的實(shí)現(xiàn)相對(duì)于sendDirectory會(huì)簡(jiǎn)單一點(diǎn)，它只需要讀取文件的內(nèi)容然后返回給客戶端就可以了。

上面的代碼寫(xiě)完后，我們其實(shí)已經(jīng)實(shí)現(xiàn)了上面說(shuō)的需求了，可是這個(gè)服務(wù)端是生產(chǎn)不可用的，因?yàn)樗泻芏酀撛诘膯?wèn)題沒(méi)有解決，接著就讓我們看一下如何解決這些問(wèn)題來(lái)優(yōu)化我們的服務(wù)端代碼。

大文件優(yōu)化

我們先來(lái)看看在現(xiàn)在的實(shí)現(xiàn)下，客戶端請(qǐng)求一個(gè)大文件會(huì)發(fā)生什么。首先我們?cè)?code>static文件夾下準(zhǔn)備一個(gè)大文件test.txt，這個(gè)文件里面有1000萬(wàn)行Hello World!，文件的大小為124M:

124M文件

然后我們啟動(dòng)服務(wù)器，查看服務(wù)器啟動(dòng)完成后Node的內(nèi)存占用情況:

Node內(nèi)存使用狀況

可以看到Node服務(wù)只占用了8.5M的內(nèi)存，我們?cè)跒g覽器訪問(wèn)一下test.txt:

瀏覽器訪問(wèn)test.tx

瀏覽器在瘋狂輸出Hello World!，這個(gè)時(shí)候再看一眼Node的內(nèi)存占用情況:

內(nèi)存激增

內(nèi)存使用一下子由8.5M激增到了132.9M，而增加的資源差不多就是文件的大小124M，這到底是為什么呢？我們?cè)賮?lái)看一下sendFile文件的實(shí)現(xiàn):

const sendFile = async (resp, pathname) => {
  // readFile會(huì)讀取文件的數(shù)據(jù)然后存在data變量里面
  const data = await fs.promises.readFile(pathname)
  resp.end(data)
}

上面的代碼中，其實(shí)我們會(huì)一次性讀取文件的內(nèi)容然后保存在data變量里面，也就是說(shuō)我們會(huì)將124M的文本信息保存在內(nèi)存里面！你試想一下，如果有多個(gè)用戶同時(shí)訪問(wèn)大資源，我們的程序肯定會(huì)因?yàn)閮?nèi)存爆炸而OOM(Out of Memory)的。那么這個(gè)問(wèn)題如何解決呢？其實(shí)node提供的stream模塊可以很好地解決我們的問(wèn)題。

Stream

我們先來(lái)看一下stream的官方介紹:

A stream is an abstract interface for working with streaming data in Node.js. There are many stream objects provided by Node.js. For instance, a request to an HTTP server and process.stdoutare both stream instances.Streams can be readable, writable, or both. All streams are instances of EventEmitter

簡(jiǎn)單來(lái)說(shuō)，stream就是給我們流式處理數(shù)據(jù)用的，那么什么是流式處理呢？用最簡(jiǎn)單的話來(lái)說(shuō)就是：不是一下子處理完數(shù)據(jù)而是一點(diǎn)一點(diǎn)地處理它們。使用stream，我們要處理的數(shù)據(jù)就會(huì)一點(diǎn)一點(diǎn)地加載到內(nèi)存的某一個(gè)固定大小的區(qū)域(buffer)以給其它消費(fèi)者消費(fèi)。由于保存數(shù)據(jù)的buffer大小一般是固定的，當(dāng)舊的數(shù)據(jù)處理完才會(huì)加載新的數(shù)據(jù)，因此它可以避免內(nèi)存的崩潰。話不多說(shuō)，我們馬上使用stream來(lái)重構(gòu)一下上面的sendFile函數(shù):

const sendFile = async (resp, pathname) => {
  // 為需要讀取的文件創(chuàng)建一個(gè)可讀流readableStream
  const fileStream = fs.createReadStream(pathname)
  fileStream.pipe(resp)
}

上面的代碼中，我們?yōu)樾枰x取的文件創(chuàng)建了一個(gè)可讀流(ReadableStream)，然后將這個(gè)流和resp對(duì)象連接(pipe)在一起，這樣文件的數(shù)據(jù)就會(huì)源源不斷發(fā)送給客戶端了。看到這里你可能會(huì)問(wèn)，為什么resp對(duì)象可以和fileStream連接在一起呢？原因就是這個(gè)resp對(duì)象底層是一個(gè)可寫(xiě)流(WritableStream)，而可讀流的pipe函數(shù)接收的就是可寫(xiě)流。優(yōu)化完后我們?cè)賮?lái)請(qǐng)求一下test.txt大文件，同樣瀏覽器一頓瘋狂輸出，不過(guò)這個(gè)時(shí)候Node服務(wù)的內(nèi)存用量是這樣的:

Stream優(yōu)化后的內(nèi)存使用

Node的內(nèi)存基本穩(wěn)定在9.0M，比服務(wù)剛啟動(dòng)時(shí)只多了0.5M！從這個(gè)可以看出我們通過(guò)stream來(lái)優(yōu)化確實(shí)達(dá)到了很好的效果。由于文章篇幅的限制，這里沒(méi)有詳細(xì)介紹stream的API如何使用，需要了解的同學(xué)可以自行查看官方文檔。

減少文件傳輸帶寬

使用stream的確可以減少服務(wù)端的內(nèi)存占用問(wèn)題，可是它沒(méi)有減少服務(wù)端和客戶端傳輸?shù)臄?shù)據(jù)大小。換句話來(lái)說(shuō)，假如我們的文件大小是2M我們就實(shí)打?qū)崅鬏斶@2M的數(shù)據(jù)給客戶端。如果客戶端是手機(jī)或者其它移動(dòng)設(shè)備的話，這么大的帶寬消耗肯定是不可取的。這個(gè)時(shí)候我們需要對(duì)被傳輸?shù)臄?shù)據(jù)進(jìn)行壓縮然后再在客戶端進(jìn)行解壓，這樣傳輸?shù)臄?shù)據(jù)量才能大幅度減少。服務(wù)端數(shù)據(jù)壓縮的算法有很多，這里我使用了一個(gè)比較常用的gzip算法，我們來(lái)看一下如何更改sendFile以支持?jǐn)?shù)據(jù)壓縮:

// 引入zlib包
const zlib = require('zlib')

const sendFile = async (resp, pathname) => {
  // 通過(guò)header告訴客戶端：服務(wù)端使用的是gzip壓縮算法
  resp.setHeader('Content-Encoding', 'gzip')
  // 創(chuàng)建一個(gè)可讀流
  const fileStream = fs.createReadStream(pathname)
  // 文件流首先通過(guò)zip處理再發(fā)送給resp對(duì)象
  fileStream.pipe(zlib.createGzip()).pipe(resp)
}

在上面的代碼中，我使用Node原生的zlib模塊創(chuàng)建了一個(gè)轉(zhuǎn)換流(Transform Stream)，這種流是既可讀又可寫(xiě)的(Readable and Writable Stream)，所以它像是一個(gè)轉(zhuǎn)換器將輸入的數(shù)據(jù)進(jìn)行加工然后輸出到下游的可寫(xiě)流。我們請(qǐng)求index.html文件來(lái)看一下優(yōu)化后的效果:

zlib壓縮效果

上圖中，第一行的請(qǐng)求是沒(méi)有經(jīng)過(guò)gzip壓縮的請(qǐng)求大小，大概是2.6kB，而經(jīng)過(guò)gzip壓縮后傳輸數(shù)據(jù)一下子變成373B，優(yōu)化效果十分顯著！

使用瀏覽器緩存

數(shù)據(jù)壓縮雖然解決了服務(wù)端客戶端傳輸數(shù)據(jù)的帶寬問(wèn)題，可是沒(méi)有解決重復(fù)數(shù)據(jù)傳輸?shù)膯?wèn)題。我們知道一般來(lái)說(shuō)服務(wù)器的靜態(tài)文件是很少會(huì)改變的，在服務(wù)端資源沒(méi)有發(fā)生改變的前提下，同一個(gè)客戶端多次訪問(wèn)同一個(gè)資源，服務(wù)端會(huì)傳輸一樣的數(shù)據(jù)，而這種情況下更有效的方式是：服務(wù)器告訴客戶端資源沒(méi)有變化，你直接使用緩存就可以了。瀏覽器緩存的方式有很多種，有協(xié)商緩存和強(qiáng)緩存。關(guān)于這兩種緩存的區(qū)別我想網(wǎng)絡(luò)上已經(jīng)有很多文章說(shuō)得很清晰了，我在這里也不再多說(shuō)，本篇文章主要想說(shuō)一下強(qiáng)緩存的Etag機(jī)制如何實(shí)現(xiàn)。

什么是Etag

其實(shí)Etag(Entity-Tag)可以理解為文件內(nèi)容的指紋，如果文件內(nèi)容發(fā)生了改變那么這個(gè)指紋是大概率是會(huì)變的。這里注意的是我用了大概率而不是絕對(duì)，這是因?yàn)?code>HTTP1.1協(xié)議里面并沒(méi)有規(guī)定etag具體生成算法是什么，這完全是由開(kāi)發(fā)者自己決定的。通常對(duì)于文件來(lái)說(shuō)，etag是由文件的長(zhǎng)度 + 更改時(shí)間生成的，這種做法其實(shí)是會(huì)存在瀏覽器讀取不到最新文件內(nèi)容的情況的，不過(guò)這不是本文的重點(diǎn)，有興趣的同學(xué)可以參考網(wǎng)上的其它資料。

接著讓我們圖解一下基于etag的協(xié)商緩存過(guò)程:

Etag交互過(guò)程

具體的過(guò)程如下:

瀏覽器第一次請(qǐng)求服務(wù)端的資源時(shí)，服務(wù)端會(huì)在Response里面設(shè)置當(dāng)前資源的etag信息，例如Etag: 5d-1834e3b6ea2
瀏覽器第二次請(qǐng)求服務(wù)端資源時(shí)，會(huì)在請(qǐng)求頭部的If-None-Match字段帶上最新的etag信息5d-1834e3b6ea2。服務(wù)端收到請(qǐng)求解析出If-None-Match字段并將其和最新的服務(wù)端etag進(jìn)行對(duì)比，如果是一樣的就會(huì)返回304給瀏覽器表示資源無(wú)更新，如果資源發(fā)生了更改則將最新的etag設(shè)置到頭部并且將最新的資源返回給瀏覽器。

接著我們來(lái)看一下sendFile函數(shù)如何支持etag:

// 這個(gè)函數(shù)會(huì)根據(jù)文件的fs.Stats信息計(jì)算出etag
const calculateEtag = (stat) => {
  // 文件的大小
  const fileLength = stat.size
  // 文件的最后更改時(shí)間
  const fileLastModifiedTime = stat.mtime.getTime()
  // 數(shù)字都用16進(jìn)制表示
  return `${fileLength.toString(16)}-${fileLastModifiedTime.toString(16)}`
}

const sendFile = async (req, resp, stat, pathname) => {
  // 文件的最新etag
  const latestEtag = calculateEtag(stat)
  // 客戶端的etag
  const clientEtag = req.headers['if-none-match']
  
  // 客戶端可以使用緩存
  if (latestEtag == clientEtag) {
    resp.statusCode = 304
    resp.end()
    return
  }
  resp.statusCode = 200
  resp.setHeader('etag', latestEtag)
  resp.setHeader('Content-Encoding', 'gzip')
  const fileStream = fs.createReadStream(pathname)
  fileStream.pipe(zlib.createGzip()).pipe(resp)
 }

在上面的代碼中我新增了一個(gè)計(jì)算etag的函數(shù)calculateEtag，這個(gè)函數(shù)會(huì)根據(jù)文件的大小和最后更改時(shí)間算出文件最新的etag信息。接著我還修改了sendFile的函數(shù)簽名，接收了req(HTTP請(qǐng)求體)和stat(文件的信息，fs.Stats類)兩個(gè)新參數(shù)。sendFile會(huì)先判斷客戶端的etag和服務(wù)端的etag是不是一樣的，如果相同就返回304給客戶端否則返回文件的最新內(nèi)容并且在header設(shè)置最新的etag信息。同樣我們?cè)俅卧L問(wèn)index.html文件來(lái)驗(yàn)證優(yōu)化效果:

etag優(yōu)化效果

上圖可以看到第一次請(qǐng)求資源時(shí)瀏覽器沒(méi)有緩存，服務(wù)端返回了文件的最新內(nèi)容和200狀態(tài)碼，這個(gè)請(qǐng)求的實(shí)際帶寬是396B，第二次請(qǐng)求時(shí)，由于瀏覽器有緩存并且服務(wù)端資源沒(méi)有更新，所以服務(wù)端返回304狀態(tài)碼而沒(méi)有返回實(shí)際的文件內(nèi)容，這個(gè)時(shí)候的文件實(shí)際帶寬是113B！可以看出優(yōu)化效果是很明顯的，我們稍微更改一下index.html的內(nèi)容來(lái)驗(yàn)證一下客戶端會(huì)不會(huì)拉到最新的數(shù)據(jù):

客戶端獲取最新內(nèi)容

從上圖可以看出當(dāng)index.html更新后，舊的etag失效，瀏覽器可以獲取最新的數(shù)據(jù)。我們最后再來(lái)看一下這三個(gè)請(qǐng)求的詳細(xì)信息，下面是第一次請(qǐng)求時(shí)，服務(wù)端給瀏覽器返回etag信息:

服務(wù)端設(shè)置etag

接著是第二次請(qǐng)求時(shí)，客戶端請(qǐng)求服務(wù)端資源時(shí)帶上etag信息:

第二次請(qǐng)求

第三次請(qǐng)求，etag失效，拿到新的數(shù)據(jù):

etag失效

值得一提的是，這里我們只通過(guò)etag實(shí)現(xiàn)了瀏覽器的緩存，這是不完備的，實(shí)際的靜態(tài)服務(wù)器可能會(huì)加上基于Expires/Cache-Control的強(qiáng)緩存和基于Last-Modified/Last-Modified-Since的協(xié)商緩存來(lái)優(yōu)化。

總結(jié)

本篇文章我先實(shí)現(xiàn)了一個(gè)最簡(jiǎn)單能用的靜態(tài)文件服務(wù)器，然后通過(guò)解決三個(gè)實(shí)際使用時(shí)會(huì)遇到的問(wèn)題優(yōu)化了我們的代碼，最后完成了一個(gè)簡(jiǎn)單高效的靜態(tài)文件服務(wù)器。

如上文所說(shuō)，由于篇幅的限制，我們的實(shí)現(xiàn)上還是漏了很多東西的，例如MIME類型的設(shè)置，支持更多的壓縮算法如deflate以及支持更多的緩存方式如Last-Modified/Last-Modified-Since等。這些內(nèi)容其實(shí)在掌握了上面的方法后很容易就可以實(shí)現(xiàn)了，所以就留給大家在需要真正用到的時(shí)候自己實(shí)現(xiàn)了。

到此這篇關(guān)于如何使用Node寫(xiě)靜態(tài)文件服務(wù)器的文章就介紹到這了,更多相關(guān)Node靜態(tài)文件服務(wù)器內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: