MySQL CHAR和VARCHAR該如何選擇
VARCHAR 和 CHAR 類型
VARCHAR 和 CHAR 是兩種主要的字符串類型,用于存儲字符。不幸的是,由于實(shí)現(xiàn)的方式依賴于存儲引擎,因此很難解釋這些字符串在磁盤和內(nèi)存中如何存儲,除了除了常用的 InnoDB 和 MyISAM 外,假設(shè)你使用了其他存儲引擎,應(yīng)當(dāng)仔細(xì)閱讀存儲引擎的文檔。
VARCHAR 存儲可變長度的字符串,也是最常用的字符數(shù)據(jù)類型。相比固定長度的類型,VARCHAR 所需的存儲空間更小,它會盡可能少地使用存儲空間(例如,短的字符串占據(jù)的空間)。對于 MyISAM 來說,如果創(chuàng)建表的時(shí)候指定了 ROW_FORMAT=FIXED 的話,那么會使用固定的空間存儲字段而導(dǎo)致空間浪費(fèi)。VARCHAR 使用1-2個(gè)額外的字節(jié)存儲字符串的長度:當(dāng)最大長度低于255字節(jié)的時(shí)候使用1個(gè)字節(jié),如果更多的話就使用2個(gè)字節(jié)。因此,拉丁字符集的 VARCHAR(10)會使用11個(gè)字節(jié)的存儲空間,而 VARCHAR(1000)則會使用1002個(gè)字節(jié)的存儲空間。
VARCHAR 由于能夠節(jié)省空間,因此可以改善性能。但是,由于長度可變,當(dāng)更新數(shù)據(jù)表的時(shí)候數(shù)據(jù)行的存儲空間會變化,這一定程度上會帶來額外的開銷。如果數(shù)據(jù)行的長度導(dǎo)致原有的存儲位置無法存放,那么不同的存儲引擎會做不同的處理。例如 MyISAM 可能產(chǎn)生數(shù)據(jù)行的碎片,而 InnoDB 需要進(jìn)行磁盤分頁來存放更新后的數(shù)據(jù)行。
通常,如果最大的列長度遠(yuǎn)遠(yuǎn)高于平均長度的話(例如可選的備注字段),使用 VARCHAR 是劃算的,同時(shí)如果更新的頻次很低,那么碎片化也不會是一個(gè)問題。需要注意的是,如果使用的是 UTF-8字符集,則實(shí)際存儲的字節(jié)長度是根據(jù)字符定的。對于中文,推薦的存儲字符集是 utf8mb4。
CHAR 類型的長度是固定的,MySQL 會對每個(gè)字段分配足夠的存儲空間。存儲CHAR 類型值的時(shí)候,MySQL 會移除后面多出來的空字符。值是使用空字符進(jìn)行對齊以便進(jìn)行比較。對于短的字符串來說,使用 CHAR 更有優(yōu)勢,而如果所有的值的長度幾乎一致的話,就可以使用 CHAR。例如存儲用戶密碼的MD5值時(shí)使用 CHAR 就更合適,這是因?yàn)?MD5的長度總是固定的。同時(shí),對于字段值經(jīng)常改變的數(shù)據(jù)類型來說,CHAR 相比 VARCHAR 也更有優(yōu)勢,因?yàn)?CHAR 不會產(chǎn)生碎片。對于很短的數(shù)據(jù)列,使用 CHAR 比 VARCHAR更高效,例如使用CHAR(1)存儲邏輯值的 Y 和 N,這種情況下只需要1個(gè)字節(jié),而 VARCHAR 需要2個(gè)字節(jié)。 對于移除空字符這個(gè)特性會感覺奇怪,我們舉個(gè)例子:
CREATE TABLE t_char_varchar_test ( id INT PRIMARY KEY, char_col CHAR(10), varchar_col VARCHAR(10) ); INSERT INTO t_char_varchar_test VALUES (1, 'string1', 'string1'), (2, ' string2', ' string2'), (3, 'string3 ', 'string3 ');
按上面的結(jié)果插入數(shù)據(jù)表后,string2中的前置空格不會移除,但使用 CHAR 類型存儲時(shí),string3尾隨空格會被移除,使用 SQL 查詢結(jié)果來檢驗(yàn)一下:
SELECT CONCAT("'", char_col, "'"), CONCAT("'", varchar_col, "'") FROM t_char_varchar_test WHERE 1
得出來的結(jié)果如下,可以看到 CHAR 類型的 string3后面的空格被移除了,而 VARCHAR類型的沒有。這種情況大多數(shù)時(shí)候不會有什么問題,實(shí)際在應(yīng)用中也經(jīng)常會使用 trim 函數(shù)移除兩端的空字符,但是如果確實(shí)需要存儲空格的時(shí)候,那就需要注意不要選擇使用 CHAR 類型:
數(shù)據(jù)如何存儲是由存儲引擎決定的,而且存儲引擎處理固定長度和可變長度的數(shù)據(jù)的方式并不相同。Memory 引擎使用固定大小的行,因此它需要分配最大可能的存儲空間——即便數(shù)據(jù)長度是可變的。但是,對于字符串的對齊和空字符截?cái)嗍怯?MySQL 服務(wù)端完成的,因此所有存儲引擎都是一樣的。
與 CHAR 和 VARCHAR 相似的是 BINARY和 VARBINARY,用于存儲二進(jìn)制字節(jié)字符,BINARY 的對齊使用字符0的字節(jié)值來對齊,并且再獲取值的時(shí)候不會截?cái)?。如果需要使用字符的字?jié)值而不是字符的話,使用 BINARY 會更高效,這是因?yàn)楸容^時(shí),一方面不需要考慮大小寫,另一方面是MySQL一次只比較一個(gè)字節(jié)。
結(jié)語:
在實(shí)際數(shù)據(jù)表設(shè)計(jì)中,大多數(shù)情況下會選擇使用 VARCHAR,但 VARCHAR 需要額外的1-2個(gè)字節(jié)存儲字符串長度。需要注意的是在應(yīng)用中最好能夠限定字段的最大長度,從而可以使得數(shù)據(jù)表盡可能使用短的 VARCHAR來提高效率。同時(shí),對于固定長度、長度很短或長度變化很小的字符類型,推薦使用 CHAR 類存儲,以提高存儲效率。
以上就是MySQL CHAR和VARCHAR的選擇的詳細(xì)內(nèi)容,更多關(guān)于MySQL CHAR和VARCHAR的資料請關(guān)注腳本之家其它相關(guān)文章!
- Mysql中varchar類型一些需要注意的地方
- MySQL CHAR和VARCHAR存儲、讀取時(shí)的差別
- MYSQL中 char 和 varchar的區(qū)別
- MySQL中字段類型char、varchar和text的區(qū)別
- mysql varchar類型求和實(shí)例操作
- 對比MySQL中int、char以及varchar的性能
- MySQL動態(tài)修改varchar長度的方法
- Mysql中varchar長度設(shè)置方法
- Mysql數(shù)據(jù)庫中把varchar類型轉(zhuǎn)化為int類型的方法
- mysql如何處理varchar與nvarchar類型中的特殊字符
- 當(dāng)面試官問mysql中char與varchar的區(qū)別
相關(guān)文章
MySQL動態(tài)創(chuàng)建表,數(shù)據(jù)分表的存儲過程
MySQL動態(tài)創(chuàng)建表,數(shù)據(jù)分表的存儲過程,需要的朋友可以參考下。2011-08-08解決阿里云ECS服務(wù)器下安裝MySQL無法遠(yuǎn)程連接的問題
這篇文章介紹了解決阿里云ECS服務(wù)器安裝MySQL無法遠(yuǎn)程連接的方法,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07MySQL 發(fā)生同步延遲時(shí)Seconds_Behind_Master還為0的原因
騰訊云數(shù)據(jù)庫 MySQL 的只讀實(shí)例出現(xiàn)了同步延遲,但是監(jiān)控的延遲時(shí)間顯示為 0,而且延遲的 binlog 距離非 0,且數(shù)值越來越大。臨時(shí)解決之后,仔細(xì)想了一想,Seconds_Behind_Master 雖然計(jì)算方式有點(diǎn)坑,但是出現(xiàn)這么“巨大”的誤差還是挺奇怪的,本文就來分析下這個(gè)問題2021-06-06解決Mysql數(shù)據(jù)庫插入數(shù)據(jù)出現(xiàn)問號(?)的解決辦法
這篇文章主要介紹了解決Mysql數(shù)據(jù)庫插入數(shù)據(jù)出現(xiàn)問號(?)的解決辦法的相關(guān)資料,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2016-07-07