Dockerfile中multi-stage(多階段構(gòu)建)詳解
前言
Docker的口號是Build,Ship,and Run Any App,Anywhere,在我們使用 Docker 的大部分時候,的確能感覺到其優(yōu)越性,但是往往在我們 Build 一個應(yīng)用的時候,是將我們的源代碼也構(gòu)建進(jìn)去的,這對于類似于 golang 這樣的編譯型語言肯定是不行的,因?yàn)閷?shí)際運(yùn)行的時候我只需要把最終構(gòu)建的二進(jìn)制包給你就行,把源碼也一起打包在鏡像中,需要承擔(dān)很多風(fēng)險,即使是腳本語言,在構(gòu)建的時候也可能需要使用到一些上線的工具,這樣無疑也增大了我們的鏡像體積。
在應(yīng)用了容器技術(shù)的軟件開發(fā)過程中,控制容器鏡像的大小可是一件費(fèi)時費(fèi)力的事情。如果我們構(gòu)建的鏡像既是編譯軟件的環(huán)境,又是軟件最終的運(yùn)行環(huán)境,這是很難控制鏡像大小的。所以常見的配置模式為:分別為軟件的編譯環(huán)境和運(yùn)行環(huán)境提供不同的容器鏡像。比如為編譯環(huán)境提供一個 Dockerfile.build,用它構(gòu)建的鏡像包含了編譯軟件需要的所有內(nèi)容,比如代碼、SDK、工具等等。同時為軟件的運(yùn)行環(huán)境提供另外一個單獨(dú)的 Dockerfile,它從 Dockerfile.build 中獲得編譯好的軟件,用它構(gòu)建的鏡像只包含運(yùn)行軟件所必須的內(nèi)容。這種情況被稱為構(gòu)造者模式(builder pattern),本文將介紹如何通過 Dockerfile 中的 multi-stage 來解決構(gòu)造者模式帶來的問題。
常見的容器鏡像構(gòu)建過程
比如我們創(chuàng)建了一個 GO 語言編寫了一個檢查頁面中超級鏈接的程序 app.go(請從 sparkdev (本地下載)獲取本文相關(guān)的代碼):
package main
import (
"encoding/json"
"fmt"
"log"
"net/http"
"net/url"
"os"
"strings"
"golang.org/x/net/html"
)
type scrapeDataStore struct {
Internal int `json:"internal"`
External int `json:"external"`
}
func isInternal(parsedLink *url.URL, siteUrl *url.URL, link string) bool {
return parsedLink.Host == siteUrl.Host || strings.Index(link, "#") == 0 || len(parsedLink.Host) == 0
}
func main() {
urlIn := os.Getenv("url")
if len(urlIn) == 0 {
urlIn = "https://www.cnblogs.com/"
}
resp, err := http.Get(urlIn)
scrapeData := &scrapeDataStore{}
tokenizer := html.NewTokenizer(resp.Body)
end := false
for {
tt := tokenizer.Next()
switch {
case tt == html.StartTagToken:
token := tokenizer.Token()
switch token.Data {
case "a":
for _, attr := range token.Attr {
if attr.Key == "href" {
link := attr.Val
parsedLink, parseLinkErr := url.Parse(link)
if parseLinkErr == nil {
if isInternal(parsedLink, siteUrl, link) {
scrapeData.Internal++
} else {
scrapeData.External++
}
}
if parseLinkErr != nil {
fmt.Println("Can't parse: " + token.Data)
}
}
}
break
}
case tt == html.ErrorToken:
end = true
break
}
if end {
break
}
}
data, _ := json.Marshal(&scrapeData)
fmt.Println(string(data))
}
下面我們通過容器來構(gòu)建它,并把它部署到生產(chǎn)型的容器鏡像中。
首先構(gòu)建編譯應(yīng)用程序的鏡像:
FROM golang:1.7.3 WORKDIR /go/src/github.com/sparkdevo/href-counter/ RUN go get -d -v golang.org/x/net/html COPY app.go . RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o app .
把上面的內(nèi)容保存到 Dockerfile.build 文件中。
接著把構(gòu)建好的應(yīng)用程序部署到生產(chǎn)環(huán)境用的鏡像中:
FROM alpine:latest RUN apk --no-cache add ca-certificates WORKDIR /root/ COPY app . CMD ["./app"]
把上面的內(nèi)容保存到 Dockerfile 文件中。
最后需要使用一個腳本把整個構(gòu)建過程整合起來:
#!/bin/sh echo Building sparkdevo/href-counter:build # 構(gòu)建編譯應(yīng)用程序的鏡像 docker build --no-cache -t sparkdevo/href-counter:build . -f Dockerfile.build # 創(chuàng)建應(yīng)用程序 docker create --name extract sparkdevo/href-counter:build # 拷貝編譯好的應(yīng)用程序 docker cp extract:/go/src/github.com/sparkdevo/href-counter/app ./app docker rm -f extract echo Building sparkdevo/href-counter:latest # 構(gòu)建運(yùn)行應(yīng)用程序的鏡像 docker build --no-cache -t sparkdevo/href-counter:latest .
把上面的內(nèi)容保存到 build.sh 文件中。這個腳本會先創(chuàng)建出一個容器來構(gòu)建應(yīng)用程序,然后再創(chuàng)建最終運(yùn)行應(yīng)用程序的鏡像。
把 app.go、Dockerfile.build、Dockerfile 和 build.sh 放在同一個目錄下,然后進(jìn)入這個目錄執(zhí)行 build.sh 腳本進(jìn)行構(gòu)建。構(gòu)建后的容器鏡像大?。?/p>

從上圖中我們可以觀察到,用于編譯應(yīng)用程序的容器鏡像大小接近 700M,而用于生產(chǎn)環(huán)境的容器鏡像只有 10.3 M,這樣的大小在網(wǎng)絡(luò)間傳輸?shù)男适呛芨叩摹?/p>
運(yùn)行下面的命令可以檢查我們構(gòu)建的容器是否可以正常的工作:
$ docker run -e url=https://www.cnblogs.com/ sparkdevo/href-counter:latest $ docker run -e url=http://www.cnblogs.com/sparkdev/ sparkdevo/href-counter:latest

OK,我們寫的程序正確的統(tǒng)計了博客園首頁和筆者的首頁中超級鏈接的情況。
采用上面的構(gòu)建過程,我們需要維護(hù)兩個 Dockerfile 文件和一個腳本文件 build.sh。能不能簡化一些呢? 下面我們看看 docker 針對這種情況提供的解決方案:multi-stage。
在 Dockerfile 中使用 multi-stage
multi-stage 允許我們在 Dockerfile 中完成類似前面 build.sh 腳本中的功能,每個 stage 可以理解為構(gòu)建一個容器鏡像,后面的 stage 可以引用前面 stage 中創(chuàng)建的鏡像。所以我們可以使用下面單個的 Dockerfile 文件實(shí)現(xiàn)前面的需求:
FROM golang:1.7.3 WORKDIR /go/src/github.com/sparkdevo/href-counter/ RUN go get -d -v golang.org/x/net/html COPY app.go . RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o app . FROM alpine:latest RUN apk --no-cache add ca-certificates WORKDIR /root/ COPY --from=0 /go/src/github.com/sparkdevo/href-counter/app . CMD ["./app"]
把上面的內(nèi)容保存到文件 Dockerfile.multi 中。這個 Dockerfile 文件的特點(diǎn)是同時存在多個 FROM 指令,每個 FROM 指令代表一個 stage 的開始部分。我們可以把一個 stage 的產(chǎn)物拷貝到另一個 stage 中。本例中的第一個 stage 完成了應(yīng)用程序的構(gòu)建,內(nèi)容和前面的 Dockerfile.build 是一樣的。第二個 stage 中的 COPY 指令通過 --from=0 引用了第一個 stage ,并把應(yīng)用程序拷貝到了當(dāng)前 stage 中。接下來讓我們編譯新的鏡像:
$ docker build --no-cache -t sparkdevo/href-counter:multi . -f Dockerfile.multi
這次使用 href-counter:multi 鏡像運(yùn)行應(yīng)用:
$ docker run -e url=https://www.cnblogs.com/ sparkdevo/href-counter:multi $ docker run -e url=http://www.cnblogs.com/sparkdev/ sparkdevo/href-counter:multi

結(jié)果和之前是一樣的。那么新生成的鏡像有沒有特別之處呢:

好吧,從上圖我們可以看到,除了 sparkdevo/href-counter:multi 鏡像,還生成了一個匿名的鏡像。因此,所謂的 multi-stage 不過時多個 Dockerfile 的語法糖罷了。但是這個語法糖還好很誘人的,現(xiàn)在我們維護(hù)一個結(jié)構(gòu)簡潔的 Dockerfile 文件就可以了!
使用命名的 stage
在上面的例子中我們通過 --from=0 引用了 Dockerfile 中第一個 stage,這樣的做法會讓 Dockerfile 變得不容易閱讀。其實(shí)我們是可以為 stage 命名的,然后就可以通過名稱來引用 stage 了。下面是改造后的 Dockerfile.mult 文件:
FROM golang:1.7.3 as builder WORKDIR /go/src/github.com/sparkdevo/href-counter/ RUN go get -d -v golang.org/x/net/html COPY app.go . RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o app . FROM alpine:latest RUN apk --no-cache add ca-certificates WORKDIR /root/ COPY --from=builder /go/src/github.com/sparkdevo/href-counter/app . CMD ["./app"]
我們把第一個 stage 使用 as 語法命名為 builder,然后在后面的 stage 中通過名稱 builder 進(jìn)行引用 --from=builder。通過使用命名的 stage, Dockerfile 更容易閱讀了。
總結(jié)
Dockerfile 中的 multi-stage 雖然只是些語法糖,但它確實(shí)為我們帶來了很多便利。尤其是減輕了 Dockerfile 維護(hù)者的負(fù)擔(dān)(要知道實(shí)際生產(chǎn)中的 Dockerfile 可不像 demo 中的這么簡單)。需要注意的是舊版本的 docker 是不支持 multi-stage 的,只有 17.05 以及之后的版本才開始支持。好了,是不是該去升級你的 docker 版本了?
好了,以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
參考:
相關(guān)文章
Docker開放2375端口實(shí)現(xiàn)遠(yuǎn)程訪問的操作方法
因?yàn)镮DEA集成docker環(huán)境,實(shí)質(zhì)上是通過遠(yuǎn)程訪問的形式,進(jìn)行連接,因此需要開啟Docker的2375端口的遠(yuǎn)程訪問權(quán)限,這篇文章主要介紹了Docker開放2375端口實(shí)現(xiàn)遠(yuǎn)程訪問的操作方法,需要的朋友可以參考下2024-05-05
docker+mongodb設(shè)置數(shù)據(jù)庫的賬號和密碼的實(shí)現(xiàn)步驟
本文主要介紹了docker+mongodb設(shè)置數(shù)據(jù)庫的賬號和密碼的實(shí)現(xiàn)步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-08-08
docker部署微信小程序自動構(gòu)建發(fā)布和更新的詳細(xì)步驟
通過 Jenkins 和 Docker 部署微信小程序,并實(shí)現(xiàn)自動構(gòu)建、發(fā)布和版本更新,主要涉及到幾個步驟,下面給大家分享docker部署微信小程序自動構(gòu)建發(fā)布和更新的詳細(xì)步驟,感興趣的朋友一起看看吧2024-12-12

