使用Node.js實(shí)現(xiàn)HTTP 206內(nèi)容分片的教程
介紹
在本文中,我會(huì)闡述HTTP狀態(tài)206 分部分內(nèi)容 的基礎(chǔ)概念,并使用Node.js一步步地實(shí)現(xiàn)它. 我們還將用一個(gè)基于它用法最常見(jiàn)場(chǎng)景的示例來(lái)測(cè)試代碼:一個(gè)能夠在任何時(shí)間點(diǎn)開(kāi)始播放視頻文件的HTML5頁(yè)面.
Partial Content 的簡(jiǎn)要介紹
HTTP 的 206 Partial Content 狀態(tài)碼和其相關(guān)的消息頭提供了讓瀏覽器以及其他用戶代理從服務(wù)器接收部分內(nèi)容而不是全部?jī)?nèi)容,這樣一種機(jī)制. 這一機(jī)制被廣泛使用在一個(gè)被大多數(shù)瀏覽器和諸如Windows Media Player和VLC Player這樣的播放器所支持視頻文件的傳輸上.
基礎(chǔ)的流程可以用下面這幾步描述:
- 瀏覽器請(qǐng)求內(nèi)容.
- 服務(wù)器告訴瀏覽器,該內(nèi)容可以使用 Accept-Ranges 消息頭進(jìn)行分部分請(qǐng)求.
- 瀏覽器重新發(fā)送請(qǐng)求,用 Range 消息頭告訴服務(wù)器需要的內(nèi)容范圍.
服務(wù)器會(huì)分如下兩種情況響應(yīng)瀏覽器的請(qǐng)求:
- 如果范圍是合理的,服務(wù)器會(huì)返回所請(qǐng)求的部分內(nèi)容,并帶上 206 Partial Content 狀態(tài)碼. 當(dāng)前內(nèi)容的范圍會(huì)在 Content-Range 消息頭中申明.
- 如果范圍是不可用的(例如,比內(nèi)容的總字節(jié)數(shù)大), 服務(wù)器會(huì)返回 416 請(qǐng)求范圍不合理 Requested Range Not Satisfiable 狀態(tài)碼. 可用的范圍也會(huì)在 Content-Range 消息頭中聲明.
讓我們來(lái)看看這幾個(gè)步驟中的每一個(gè)關(guān)鍵消息頭.
Accept-Ranges: 字節(jié)(bytes)
這是會(huì)有服務(wù)器發(fā)送的字節(jié)頭,展示可以被分部分發(fā)送給瀏覽器的內(nèi)容. 這個(gè)值聲明了可被接受的每一個(gè)范圍請(qǐng)求, 大多數(shù)情況下是字節(jié)數(shù) bytes.
Range: 字節(jié)數(shù)(bytes)=(開(kāi)始)-(結(jié)束)
這是瀏覽器告知服務(wù)器所需分部分內(nèi)容范圍的消息頭. 注意開(kāi)始和結(jié)束位置是都包括在內(nèi)的,而且是從0開(kāi)始的. 這個(gè)消息頭也可以不發(fā)送兩個(gè)位置,其含義如下:
- 如果結(jié)束位置被去掉了,服務(wù)器會(huì)返回從聲明的開(kāi)始位置到整個(gè)內(nèi)容的結(jié)束位置內(nèi)容的最后一個(gè)可用字節(jié).
- 如果開(kāi)始位置被去掉了,結(jié)束位置參數(shù)可以被描述成從最后一個(gè)可用的字節(jié)算起可以被服務(wù)器返回的字節(jié)數(shù).
Content-Range:字節(jié)數(shù)(bytes)=(開(kāi)始)-(結(jié)束)/(總數(shù))
這個(gè)消息頭將會(huì)跟隨 HTTP 狀態(tài)碼 206 一起出現(xiàn). 開(kāi)始和結(jié)束的值展示了當(dāng)前內(nèi)容的范圍. 跟 Range 消息頭一樣, 兩個(gè)值都是包含在內(nèi)的,并且也是從零開(kāi)始的. 總數(shù)這個(gè)值聲明了可用字節(jié)的總數(shù).
Content-Range: */(總數(shù))
這個(gè)頭信息和上面一個(gè)是一樣的,不過(guò)是用另一種格式,并且僅在返回HTTP狀態(tài)碼416時(shí)被發(fā)送。其中總數(shù)代表了正文總共可用的字節(jié)數(shù)。
這里有一對(duì)有2048個(gè)字節(jié)文件的例子。注意省略起點(diǎn)和重點(diǎn)的區(qū)別。
請(qǐng)求開(kāi)始的1024個(gè)字節(jié)
瀏覽器發(fā)送:
GET /dota2/techies.mp4 HTTP/1.1 Host: localhost:8000 Range: bytes=0-1023
服務(wù)器返回:
HTTP/1.1 206 Partial Content Date: Mon, 15 Sep 2014 22:19:34 GMT Content-Type: video/mp4 Content-Range: bytes 0-1023/2048 Content-Length: 1024 (Content...)
沒(méi)有終點(diǎn)位置的請(qǐng)求
瀏覽器發(fā)送:
GET /dota2/techies.mp4 HTTP/1.1 Host: localhost:8000 Range: bytes=1024-
服務(wù)器返回:
HTTP/1.1 206 Partial Content Date: Mon, 15 Sep 2014 22:19:34 GMT Content-Type: video/mp4 Content-Range: bytes 1024-2047/2048 Content-Length: 1024 (Content...)
注意:服務(wù)器并不需要在單個(gè)響應(yīng)中返回所有剩下的字節(jié),特別是當(dāng)正文太長(zhǎng)或者有其他性能的考慮。所以下面的兩個(gè)例子在這種情況下也是可接受的:
Content-Range: bytes 1024-1535/2048 Content-Length: 512
服務(wù)器僅返回剩余正文的一半。下一次請(qǐng)求的范圍將從第1536個(gè)字節(jié)開(kāi)始。
Content-Range: bytes 1024-1279/2048 Content-Length: 256
服務(wù)器僅返回剩余正文的256個(gè)字節(jié)。下一次請(qǐng)求的范圍將從第1280個(gè)字節(jié)開(kāi)始。
請(qǐng)求最后512個(gè)字節(jié)
瀏覽器發(fā)送:
GET /dota2/techies.mp4 HTTP/1.1 Host: localhost:8000 Range: bytes=-512
服務(wù)器返回:
HTTP/1.1 206 Partial Content Date: Mon, 15 Sep 2014 22:19:34 GMT Content-Type: video/mp4 Content-Range: bytes 1536-2047/2048 Content-Length: 512 (Content...)
請(qǐng)求不可用的范圍:
瀏覽器發(fā)送:
GET /dota2/techies.mp4 HTTP/1.1 Host: localhost:8000 Range: bytes=1024-4096
服務(wù)器返回:
HTTP/1.1 416 Requested Range Not Satisfiable Date: Mon, 15 Sep 2014 22:19:34 GMT Content-Range: bytes */2048
理解了工作流和頭部信息后,現(xiàn)在我們可以用Node.js去實(shí)現(xiàn)這個(gè)機(jī)制。
開(kāi)始用Node.js實(shí)現(xiàn)
第一步:創(chuàng)建一個(gè)簡(jiǎn)單的HTTP服務(wù)器
我們將像下面的例子那樣,從一個(gè)基本的HTTP服務(wù)器開(kāi)始。這已經(jīng)可以基本足夠處理大多數(shù)的瀏覽器請(qǐng)求了。首先,我們初始化我們需要用到的對(duì)象,并且用initFolder來(lái)代表文件的位置。為了生成Content-Type頭部,我們列出文件擴(kuò)展名和它們相對(duì)應(yīng)的MIME名稱(chēng)來(lái)構(gòu)成一個(gè)字典。在回調(diào)函數(shù)httpListener()中,我們將僅允許GET可用。如果出現(xiàn)其他方法,服務(wù)器將返回405 Method Not Allowed,在文件不存在于initFolder,服務(wù)器將返回404 Not Found。
// 初始化需要的對(duì)象
var http = require("http");
var fs = require("fs");
var path = require("path");
var url = require("url");
// 初始的目錄,隨時(shí)可以改成你希望的目錄
var initFolder = "C:\\Users\\User\\Videos";
// 將我們需要的文件擴(kuò)展名和MIME名稱(chēng)列出一個(gè)字典
var mimeNames = {
".css": "text/css",
".html": "text/html",
".js": "application/javascript",
".mp3": "audio/mpeg",
".mp4": "video/mp4",
".ogg": "application/ogg",
".ogv": "video/ogg",
".oga": "audio/ogg",
".txt": "text/plain",
".wav": "audio/x-wav",
".webm": "video/webm";
};
http.createServer(httpListener).listen(8000);
function httpListener (request, response) {
// 我們將只接受GET請(qǐng)求,否則返回405 'Method Not Allowed'
if (request.method != "GET") {
sendResponse(response, 405, {"Allow" : "GET"}, null);
return null;
}
var filename =
initFolder + url.parse(request.url, true, true).pathname.split('/').join(path.sep);
var responseHeaders = {};
var stat = fs.statSync(filename);
// 檢查文件是否存在,不存在就返回404 Not Found
if (!fs.existsSync(filename)) {
sendResponse(response, 404, null, null);
return null;
}
responseHeaders["Content-Type"] = getMimeNameFromExt(path.extname(filename));
responseHeaders["Content-Length"] = stat.size; // 文件大小
sendResponse(response, 200, responseHeaders, fs.createReadStream(filename));
}
function sendResponse(response, responseStatus, responseHeaders, readable) {
response.writeHead(responseStatus, responseHeaders);
if (readable == null)
response.end();
else
readable.on("open", function () {
readable.pipe(response);
});
return null;
}
function getMimeNameFromExt(ext) {
var result = mimeNames[ext.toLowerCase()];
// 最好給一個(gè)默認(rèn)值
if (result == null)
result = "application/octet-stream";
return result;
}
步驟 2 - 使用正則表達(dá)式捕獲Range消息頭
有了這個(gè)HTTP服務(wù)器做基礎(chǔ),我們現(xiàn)在就可以用如下代碼處理Range消息頭了. 我們使用正則表達(dá)式將消息頭分割,以獲取開(kāi)始和結(jié)束字符串。然后使用 parseInt() 方法將它們轉(zhuǎn)換成整形數(shù). 如果返回值是 NaN (非數(shù)字not a number), 那么這個(gè)字符串就是沒(méi)有在這個(gè)消息頭中的. 參數(shù)totalLength展示了當(dāng)前文件的總字節(jié)數(shù). 我們將使用它計(jì)算開(kāi)始和結(jié)束位置.
function readRangeHeader(range, totalLength) {
/*
* Example of the method 'split' with regular expression.
*
* Input: bytes=100-200
* Output: [null, 100, 200, null]
*
* Input: bytes=-200
* Output: [null, null, 200, null]
*/
if (range == null || range.length == 0)
return null;
var array = range.split(/bytes=([0-9]*)-([0-9]*)/);
var start = parseInt(array[1]);
var end = parseInt(array[2]);
var result = {
Start: isNaN(start) ? 0 : start,
End: isNaN(end) ? (totalLength - 1) : end
};
if (!isNaN(start) && isNaN(end)) {
result.Start = start;
result.End = totalLength - 1;
}
if (isNaN(start) && !isNaN(end)) {
result.Start = totalLength - end;
result.End = totalLength - 1;
}
return result;
}
步驟 3 - 檢查數(shù)據(jù)范圍是否合理
回到函數(shù) httpListener(), 在HTTP方法通過(guò)之后,現(xiàn)在我們來(lái)檢查請(qǐng)求的數(shù)據(jù)范圍是否可用. 如果瀏覽器沒(méi)有發(fā)送 Range 消息頭過(guò)來(lái), 請(qǐng)求就會(huì)直接被當(dāng)做一般的請(qǐng)求對(duì)待. 服務(wù)器會(huì)返回整個(gè)文件,HTTP狀態(tài)將會(huì)是 200 OK. 另外我們還會(huì)看看開(kāi)始和結(jié)束位置是否比文件長(zhǎng)度更大或者相等. 只要有一個(gè)是這種情況,請(qǐng)求的數(shù)據(jù)范圍就是不能被滿足的. 返回的狀態(tài)就將會(huì)是 416 Requested Range Not Satisfiable 而 Content-Range 也會(huì)被發(fā)送.
var responseHeaders = {};
var stat = fs.statSync(filename);
var rangeRequest = readRangeHeader(request.headers['range'], stat.size);
// If 'Range' header exists, we will parse it with Regular Expression.
if (rangeRequest == null) {
responseHeaders['Content-Type'] = getMimeNameFromExt(path.extname(filename));
responseHeaders['Content-Length'] = stat.size; // File size.
responseHeaders['Accept-Ranges'] = 'bytes';
// If not, will return file directly.
sendResponse(response, 200, responseHeaders, fs.createReadStream(filename));
return null;
}
var start = rangeRequest.Start;
var end = rangeRequest.End;
// If the range can't be fulfilled.
if (start >= stat.size || end >= stat.size) {
// Indicate the acceptable range.
responseHeaders['Content-Range'] = 'bytes */' + stat.size; // File size.
// Return the 416 'Requested Range Not Satisfiable'.
sendResponse(response, 416, responseHeaders, null);
return null;
}
步驟 4 - 滿足請(qǐng)求
最后使人迷惑的一塊來(lái)了。對(duì)于狀態(tài) 216 Partial Content, 我們有另外一種格式的 Content-Range 消息頭,包括開(kāi)始,結(jié)束位置以及當(dāng)前文件的總字節(jié)數(shù). 我們也還有 Content-Length 消息頭,其值就等于開(kāi)始和結(jié)束位置之間的差。在最后一句代碼中,我們調(diào)用了 createReadStream() 并將開(kāi)始和結(jié)束位置的值給了第二個(gè)參數(shù)選項(xiàng)的對(duì)象, 這意味著返回的流將只包含從開(kāi)始到結(jié)束位置的只讀數(shù)據(jù).
// Indicate the current range.
responseHeaders['Content-Range'] = 'bytes ' + start + '-' + end + '/' + stat.size;
responseHeaders['Content-Length'] = start == end ? 0 : (end - start + 1);
responseHeaders['Content-Type'] = getMimeNameFromExt(path.extname(filename));
responseHeaders['Accept-Ranges'] = 'bytes';
responseHeaders['Cache-Control'] = 'no-cache';
// Return the 206 'Partial Content'.
sendResponse(response, 206,
responseHeaders, fs.createReadStream(filename, { start: start, end: end }));
下面是完整的 httpListener() 回調(diào)函數(shù).
function httpListener(request, response) {
// We will only accept 'GET' method. Otherwise will return 405 'Method Not Allowed'.
if (request.method != 'GET') {
sendResponse(response, 405, { 'Allow': 'GET' }, null);
return null;
}
var filename =
initFolder + url.parse(request.url, true, true).pathname.split('/').join(path.sep);
// Check if file exists. If not, will return the 404 'Not Found'.
if (!fs.existsSync(filename)) {
sendResponse(response, 404, null, null);
return null;
}
var responseHeaders = {};
var stat = fs.statSync(filename);
var rangeRequest = readRangeHeader(request.headers['range'], stat.size);
// If 'Range' header exists, we will parse it with Regular Expression.
if (rangeRequest == null) {
responseHeaders['Content-Type'] = getMimeNameFromExt(path.extname(filename));
responseHeaders['Content-Length'] = stat.size; // File size.
responseHeaders['Accept-Ranges'] = 'bytes';
// If not, will return file directly.
sendResponse(response, 200, responseHeaders, fs.createReadStream(filename));
return null;
}
var start = rangeRequest.Start;
var end = rangeRequest.End;
// If the range can't be fulfilled.
if (start >= stat.size || end >= stat.size) {
// Indicate the acceptable range.
responseHeaders['Content-Range'] = 'bytes */' + stat.size; // File size.
// Return the 416 'Requested Range Not Satisfiable'.
sendResponse(response, 416, responseHeaders, null);
return null;
}
// Indicate the current range.
responseHeaders['Content-Range'] = 'bytes ' + start + '-' + end + '/' + stat.size;
responseHeaders['Content-Length'] = start == end ? 0 : (end - start + 1);
responseHeaders['Content-Type'] = getMimeNameFromExt(path.extname(filename));
responseHeaders['Accept-Ranges'] = 'bytes';
responseHeaders['Cache-Control'] = 'no-cache';
// Return the 206 'Partial Content'.
sendResponse(response, 206,
responseHeaders, fs.createReadStream(filename, { start: start, end: end }));
}
測(cè)試實(shí)現(xiàn)
我們?cè)趺磥?lái)測(cè)試我們的代碼呢?就像在介紹中提到的,部分正文最常用的場(chǎng)景是流和播放視頻。所以我們創(chuàng)建了一個(gè)ID為mainPlayer并包含一個(gè)<source/>標(biāo)簽的<video/>。函數(shù)onLoad()將在mainPlayer預(yù)讀取當(dāng)前視頻的元數(shù)據(jù)時(shí)被觸發(fā),這用于檢查在URL中是否有數(shù)字參數(shù),如果有,mainPlayer將跳到指定的時(shí)間點(diǎn)。
<!DOCTYPE html>
<html>
<head>
<script type="text/javascript">
function onLoad() {
var sec = parseInt(document.location.search.substr(1));
if (!isNaN(sec))
mainPlayer.currentTime = sec;
}
</script>
<title>Partial Content Demonstration</title>
</head>
<body>
<h3>Partial Content Demonstration</h3>
<hr />
<video id="mainPlayer" width="640" height="360"
autoplay="autoplay" controls="controls" onloadedmetadata="onLoad()">
<source src="dota2/techies.mp4" />
</video>
</body>
</html>
現(xiàn)在我們把頁(yè)面保存為"player.html"并和"dota2/techies.mp4"一起放在initFolder目錄下。然后在瀏覽器中打開(kāi)URL:http://localhost:8000/player.html
在Chrome中看起來(lái)像這樣:

因?yàn)樵赨RL中沒(méi)有任何參數(shù),文件將從最開(kāi)始出播放。
接下來(lái)就是有趣的部分了。讓我們?cè)囍蜷_(kāi)這個(gè)然后看看發(fā)生了什么:http://localhost:8000/player.html?60

如果你按F12來(lái)打開(kāi)Chrome的開(kāi)發(fā)者工具,切換到網(wǎng)絡(luò)標(biāo)簽頁(yè),然后點(diǎn)擊查看最近一次日志的詳細(xì)信息。你會(huì)發(fā)現(xiàn)范圍的頭信息(Range)被你的瀏覽器發(fā)送了:
Range:bytes=225084502-
很有趣,對(duì)吧?當(dāng)函數(shù)onLoad()改變currentTime屬性的時(shí)候,瀏覽器計(jì)算這部視頻60秒處的字節(jié)位置。因?yàn)閙ainPlayer已經(jīng)預(yù)加載了元數(shù)據(jù),包括格式、比特率和其他基本信息,這個(gè)起始位置立刻就被得到了。之后,瀏覽器就可以下載并播放視頻而不需要請(qǐng)求開(kāi)頭的60秒了。成功了!
結(jié)論
我們已經(jīng)用Node.js來(lái)實(shí)現(xiàn)支持部分正文的HTTP服務(wù)器端了。我們也用HTML5頁(yè)面測(cè)試了。但這只是一個(gè)開(kāi)始。如果你對(duì)頭部信息和工作流這些都已經(jīng)理解透徹了,你可以試著用其他像ASP.NET MVC或者WCF服務(wù)這類(lèi)框架來(lái)實(shí)現(xiàn)它。但是不要忘記啟動(dòng)任務(wù)管理器來(lái)查看CPU和內(nèi)存的使用。像我們?cè)谥坝懻摰降?,服?wù)器沒(méi)有在單個(gè)響應(yīng)中返回所用剩余的字節(jié)。要找到性能的平衡點(diǎn)將是一項(xiàng)重要的任務(wù)。
- node.js實(shí)現(xiàn)爬蟲(chóng)教程
- 在Node.js中使用HTTP上傳文件的方法
- node.js中的http.createClient方法使用說(shuō)明
- node.js中的http.response.addTrailers方法使用說(shuō)明
- node.js中的http.response.getHeader方法使用說(shuō)明
- node.js中的http.response.write方法使用說(shuō)明
- node.js中的http.response.removeHeader方法使用說(shuō)明
- node.js中的http.request.end方法使用說(shuō)明
- Node.js生成HttpStatusCode輔助類(lèi)發(fā)布到npm
- Node.js中Request模塊處理HTTP協(xié)議請(qǐng)求的基本使用教程
相關(guān)文章
node.js中的querystring.parse方法使用說(shuō)明
這篇文章主要介紹了node.js中的querystring.parse方法使用說(shuō)明,本文介紹了querystring.parse的方法說(shuō)明、語(yǔ)法、接收參數(shù)、使用實(shí)例和實(shí)現(xiàn)源碼,需要的朋友可以參考下2014-12-12
nodeJs爬蟲(chóng)的技術(shù)點(diǎn)總結(jié)
本篇文章給大家總結(jié)了關(guān)于nodeJs爬蟲(chóng)的技術(shù)點(diǎn)的相關(guān)知識(shí),對(duì)爬蟲(chóng)有興趣的朋友可以跟著學(xué)習(xí)參考下。2018-05-05
Nodejs極簡(jiǎn)入門(mén)教程(一):模塊機(jī)制
這篇文章主要介紹了Nodejs極簡(jiǎn)入門(mén)教程(一):模塊機(jī)制,本文講解了模塊基礎(chǔ)知識(shí)、模塊的加載、包等內(nèi)容,需要的朋友可以參考下2014-10-10
詳解Node.js使用token進(jìn)行認(rèn)證的簡(jiǎn)單示例
這篇文章主要介紹了詳解Node.js使用token進(jìn)行認(rèn)證的簡(jiǎn)單示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-05-05
Node.js使用MongoDB的ObjectId作為查詢(xún)條件的方法
這篇文章主要介紹了Node.js使用MongoDB的ObjectId作為查詢(xún)條件的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-09-09

