Go語言中的Base64編碼原理介紹以及使用
前言
在網(wǎng)絡(luò)中傳遞參數(shù)時,我們經(jīng)常會對參數(shù)進(jìn)行Base64編碼,那么Go 語言中如何進(jìn)行Base64編碼呢?Base64編碼的原理是怎樣的呢?通過這篇文章一起來了解下吧!
Go Base64編碼
標(biāo)準(zhǔn)Base64編碼
// 標(biāo)準(zhǔn)Base64編碼 ?? ?src := "hello world" ?? ?res := base64.StdEncoding.EncodeToString([]byte(src)) ?? ?fmt.Println(res) // aGVsbG8gd29ybGQ= ?? ?// 標(biāo)準(zhǔn)Base64解碼 ?? ?s, err := base64.StdEncoding.DecodeString(res) ?? ?fmt.Println(string(s), err) // hello world <nil>
Base64 URL 編碼
標(biāo)準(zhǔn)Base64編碼后會有 ‘+‘號,在HTTP URL傳輸時,'+‘號會被解析成空格,這樣服務(wù)端接收到的數(shù)據(jù)和傳輸?shù)臄?shù)據(jù)就不一致。因此衍生出了Base64 URL編碼,這種編碼會把’+‘變?yōu)?rsquo;-',便于在URL中傳輸。
因此如果想要將編碼后的數(shù)據(jù)放在 HTTP URL中傳輸,應(yīng)該使用該編碼方式。
// Base64 URL 編碼 src := "信息" res := base64.URLEncoding.EncodeToString([]byte(src)) fmt.Println(res) // 5L-h5oGv // Base64 URL 解碼 s, err := base64.URLEncoding.DecodeString(res) fmt.Println(string(s), err) // 信息 <nil>
什么是Base64編碼
Base64是網(wǎng)絡(luò)上最常見的用于傳輸8Bit字節(jié)碼的編碼方式之一,是一種基于64個可打印字符來表示二進(jìn)制數(shù)據(jù)的方法。Base64編碼是從二進(jìn)制到字符的過程,可用于在HTTP環(huán)境下傳遞較長的標(biāo)識信息。采用Base64編碼具有不可讀性,需要解碼后才能閱讀。—百度百科
通過百度百科的介紹,我們可以獲得如下信息:
- Base64是一種編碼方式,將二進(jìn)制編碼為字符
- Base64編碼后的字符范圍為64個可打印字符
- 編碼后的結(jié)果具有不可讀性,需要解碼:即Base64不是加密方法,而是編碼方式,是從一種語言翻譯為另一種語言,當(dāng)然也可以翻譯回去
為什么需要Base64編碼
我們都知道計算機(jī)的世界,是由0和1組成的,那么0和1的組合如何表示現(xiàn)實語言呢,這就出現(xiàn)了ASCII 碼。ASCII 是由美國設(shè)計的,一共128個字符,其中規(guī)定了第0~31及127(共33個)是控制字符或通信專用字符,32~126(共95個)是可打印字符。比如10(0000 1001)表示換行,65(0100 0001)表示大寫字母A。
最初的許多協(xié)議都是基于 ASCII 設(shè)計的,只能傳輸可打印字符。比如發(fā)郵件時使用的 SMTP(簡單郵件傳輸協(xié)議),最初只能傳輸純文本,對圖片、語音等二進(jìn)制文件的支持并不是太好。
那么我們想傳輸這些包含不可打印字符的數(shù)據(jù)怎么辦,一種方式就是設(shè)計一種編碼方式,將不可打印字符轉(zhuǎn)為可打印字符,這樣這些數(shù)據(jù)就可以傳輸了,收到這些數(shù)據(jù)后,再解碼回來,得到原始數(shù)據(jù)。Base64就是為了解決這個問題的。
對于現(xiàn)在的協(xié)議來說,都針對二進(jìn)制文件做了處理,但我們無法保證文件在網(wǎng)絡(luò)傳輸過程中不出現(xiàn)問題。當(dāng)包含不可打印字符的文件在網(wǎng)絡(luò)中傳輸時,往往要經(jīng)過多個路由設(shè)備,由于不同的設(shè)備(特指老的路由設(shè)備)對字節(jié)流的處理方式有一些不同,這樣那些不可打印字節(jié)就有可能被錯誤處理,不利于數(shù)據(jù)傳輸?shù)?。所以就先把?shù)據(jù)先做一個編碼,統(tǒng)統(tǒng)變成可見字節(jié),確保數(shù)據(jù)可靠傳輸。
Base64編碼原理
Base64之所以叫做Base64,是因為它是基于64個可打印字符設(shè)計的,這64個字符是 ASCII 編碼中可打印字符的子集,包含26個字母的大小寫、10個阿拉伯?dāng)?shù)字、'+‘號 和 ‘/‘號。(其實還有一個 ‘=’ 號用于后綴)
編碼步驟
由于一共有 64 個字符,那么使用 6 個比特位就足夠表示了(2的6次方=64),而 ASCII碼 使用 8 個比特位表示一個字符,6 和 8 的最小公倍數(shù)為 24,3個 ASCII碼 字符可以編碼為 4 個 Base64 字符。因此Base64的編碼過程如下:
- 將原始數(shù)據(jù)每三個字節(jié)分為一組,一共24個比特位
- 將24個比特位分為4組,每組6個比特位
- 計算每組的十進(jìn)制值,根據(jù)編碼對照表,得到可打印字符串
以維基百科上舉的例子做個演示:
- 給定單詞 ‘Man’,一共三個字節(jié)
- 根據(jù)ASCII編碼,得到24個比特位
- 6個一組,分為4組
- 計算每組的十進(jìn)制值分別為 19、22、5、46,對照Base64編碼表,得到可打印字符串為 ‘TWFu’
需要注意的是,使用Base64編碼后,3個字節(jié)會轉(zhuǎn)為4個字節(jié),編碼后的需要傳輸?shù)臄?shù)據(jù)比編碼前多了 1/3。
位數(shù)不足情況
位數(shù)不足會有兩種情況:兩個字節(jié)或者一個字節(jié)的數(shù)據(jù)。
如果是兩個字節(jié),也就是16個比特,需要補兩個0,得到三個Base64編碼字符,最后添加一個’=‘用于補充
如果是一個字節(jié),也就是8個比特,需要補4個0,得到兩個Base64編碼字符,最后添加兩個’=‘用于補充
Base64解碼原理
解碼就是編碼的逆向操作:
- 去掉結(jié)尾的’=‘號
- 根據(jù)Base64編碼表,找到每個字符對應(yīng)的編碼值
- 取每個編碼值的后6位,形成二進(jìn)制串
- 對上述二進(jìn)制串,每8個構(gòu)成一個字節(jié),如果最后一組不夠8個,一定全是0,丟棄掉
- 此時得到的就是原始數(shù)據(jù)的二進(jìn)制編碼,再根據(jù)編碼方式(例如 ASCII )等進(jìn)行解碼
例如對于上述 ‘Ma’ 的編碼值 ‘TWE=’ 進(jìn)行解碼:
- 去掉’=',得到 ‘TWE’
- ‘T’:19,‘W’:22,‘E’:4
- 010011 010110 000100
- 01001101 01100001
- M a
Base64標(biāo)準(zhǔn)編碼變種
我們有時候會將Base64編碼后的字符串,當(dāng)前 HTTP URL 中的參數(shù)進(jìn)行傳遞,但是標(biāo)準(zhǔn)的 Base64 并不適合直接放在URL里傳輸,因為對于 ‘+‘號,使用url encode時會被encode 為空格,比如編碼后的值是 ‘ab+cd’,但是使用url encode 后變成了 ‘ab cd’,那么對方接收到的也是’ab cd’,此時再解碼肯定失敗了。
為解決此問題,衍生出一種用于URL的改進(jìn)Base64編碼,它不僅在末尾去掉填充的’=‘號,并將標(biāo)準(zhǔn)Base64中的“+”和“/”分別改成了“-”和“_”。
總結(jié)
本篇文章,我們學(xué)習(xí)了如下內(nèi)容:
- Go 語言中如何進(jìn)行 Base64編碼
- Base64編碼和解碼原理
- Base64不是加密算法,而是一種編碼方式
- Base64編碼后的數(shù)據(jù)量是原數(shù)據(jù)大小的4/3左右
到此這篇關(guān)于Go語言中Base64編碼原理介紹以及使用的文章就介紹到這了,更多相關(guān)Go語言的Base64編碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章

關(guān)于Go語言中特有的設(shè)計模式與實現(xiàn)方式講解