快捷導(dǎo)航

MySQL中Join的算法(NLJ、BNL、BKA)詳解

更新時(shí)間：2023年07月12日 11:30:10 作者：碼農(nóng)BookSea

這篇文章主要介紹了MySQL中Join的算法(NLJ、BNL、BKA)詳解，Join是MySQL中最常見的查詢操作之一，用于從多個(gè)表中獲取數(shù)據(jù)并將它們組合在一起,本文將探討這兩種算法的工作原理，以及如何在MySQL中使用它們

什么是Join

在MySQL中，Join是一種用于組合兩個(gè)或多個(gè)表中數(shù)據(jù)的查詢操作。

Join操作通?；趦蓚€(gè)表中的某些共同的列進(jìn)行，這些列在兩個(gè)表中都存在。

MySQL支持多種類型的Join操作，如Inner Join、Left Join、Right Join、Full Join等。

Inner Join是最常見的Join類型之一。在Inner Join操作中，只有在兩個(gè)表中都存在的行才會(huì)被返回。

例如，如果我們有一個(gè)“customers”表和一個(gè)“orders”表，我們可以通過在這兩個(gè)表中共享“customer_id”列來組合它們的數(shù)據(jù)。

SELECT *
FROM customers
INNER JOIN orders
ON customers.customer_id = orders.customer_id;

上面的查詢將返回所有存在于“customers”和“orders”表中的“customer_id”列相同的行。

Index Nested-Loop Join

Index Nested-Loop Join（NLJ）算法是Join算法中最基本的算法之一。在NLJ算法中，MySQL首先選擇一個(gè)表（通常是小型表）作為驅(qū)動(dòng)表，并迭代該表中的每一行。然后，MySQL在第二個(gè)表中搜索匹配條件的行，這個(gè)搜索過程通常使用索引來完成。一旦找到匹配的行，MySQL將這些行組合在一起，并將它們作為結(jié)果集返回。

工作流程如圖：

例如，下面這個(gè)語句：

select * from t1 straight_join t2 on (t1.a=t2.a);

在這個(gè)語句里，假設(shè)t1 是驅(qū)動(dòng)表，t2是被驅(qū)動(dòng)表。我們來看一下這條語句的explain結(jié)果。

可以看到，在這條語句里，被驅(qū)動(dòng)表t2的字段a上有索引，join過程用上了這個(gè)索引，因此這個(gè)語句的執(zhí)行流程是這樣的：

從表t1中讀入一行數(shù)據(jù) R；
從數(shù)據(jù)行R中，取出a字段到表t2里去查找；
取出表t2中滿足條件的行，跟R組成一行，作為結(jié)果集的一部分；
重復(fù)執(zhí)行步驟1到3，直到表t1的末尾循環(huán)結(jié)束。

這個(gè)過程就跟我們寫程序時(shí)的嵌套查詢類似，并且可以用上被驅(qū)動(dòng)表的索引，所以我們稱之為**“Index Nested-Loop Join”，簡稱NLJ**。

NLJ是使用上了索引的情況，如果查詢條件沒有使用到索引呢？

MySQL會(huì)選擇使用另一個(gè)叫作**“Block Nested-Loop Join”的算法，簡稱BNL**。

Block Nested-Loop Join

Block Nested Loop Join（BNL）算法與NLJ算法不同的是，BNL算法使用一個(gè)類似于緩存的機(jī)制，將表數(shù)據(jù)分成多個(gè)塊，然后逐個(gè)處理這些塊，以減少內(nèi)存和CPU的消耗。

例如，下面這個(gè)語句：

select * from t1 straight_join t2 on (t1.a=t2.b);

字段b上是沒有建立索引的。

這時(shí)候，被驅(qū)動(dòng)表上沒有可用的索引，算法的流程是這樣的：

把表t1的數(shù)據(jù)讀入線程內(nèi)存join_buffer中，由于我們這個(gè)語句中寫的是select *，因此是把整個(gè)表t1放入了內(nèi)存；掃描表t2，把表t2中的每一行取出來，跟join_buffer中的數(shù)據(jù)做對(duì)比，滿足join條件的，作為結(jié)果集的一部分返回。

這條SQL語句的explain結(jié)果如下所示：

可以看到，在這個(gè)過程中，對(duì)表t1和t2都做了一次全表掃描，因此總的掃描行數(shù)是1100。由于join_buffer是以無序數(shù)組的方式組織的，因此對(duì)表t2中的每一行，都要做100次判斷，總共需要在內(nèi)存中做的判斷次數(shù)是：100*1000=10萬次。

雖然Block Nested-Loop Join算法是全表掃描。但是是在內(nèi)存中進(jìn)行的判斷操作，速度上會(huì)快很多。但是性能仍然不如NLJ。

join_buffer的大小是由參數(shù)join_buffer_size設(shè)定的，默認(rèn)值是256k。如果放不下表t1的所有數(shù)據(jù)話，策略很簡單，就是分段放。

順序讀取數(shù)據(jù)行放入join_buffer中，直到j(luò)oin_buffer滿了。
掃描被驅(qū)動(dòng)表跟join_buffer中的數(shù)據(jù)做對(duì)比，滿足join條件的，作為結(jié)果集的一部分返回。
清空join_buffer，重復(fù)上述步驟。

雖然分成多次放入join_buffer，但是判斷等值條件的次數(shù)還是不變的，依然是10萬次。

MRR & BKA

上篇文章里我們講到了MRR（Multi-Range Read）。MySQL在5.6版本后引入了Batched Key Acess(BKA)算法了。這個(gè)BKA算法，其實(shí)就是對(duì)NLJ算法的優(yōu)化，BKA算法正是基于MRR。

NLJ算法執(zhí)行的邏輯是：從驅(qū)動(dòng)表t1，一行行地取出a的值，再到被驅(qū)動(dòng)表t2去做join。也就是說，對(duì)于表t2來說，每次都是匹配一個(gè)值。這時(shí)，MRR的優(yōu)勢就用不上了。

我們可以從表t1里一次性地多拿些行出來，，先放到一個(gè)臨時(shí)內(nèi)存，一起傳給表t2。這個(gè)臨時(shí)內(nèi)存不是別人，就是join_buffer。

通過上一篇文章，我們知道join_buffer 在BNL算法里的作用，是暫存驅(qū)動(dòng)表的數(shù)據(jù)。但是在NLJ算法里并沒有用。那么，我們剛好就可以復(fù)用join_buffer到BKA算法中。

NLJ算法優(yōu)化后的BKA算法的流程，如圖所示：

圖中，我在join_buffer中放入的數(shù)據(jù)是P1~P100，表示的是只會(huì)取查詢需要的字段。當(dāng)然，如果join buffer放不下P1~P100的所有數(shù)據(jù)，就會(huì)把這100行數(shù)據(jù)分成多段執(zhí)行上圖的流程。

如果要使用BKA優(yōu)化算法的話，你需要在執(zhí)行SQL語句之前，先設(shè)置

set optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on';

其中，前兩個(gè)參數(shù)的作用是要啟用MRR。這么做的原因是，BKA算法的優(yōu)化要依賴于MRR。

對(duì)于BNL，我們可以通過建立索引轉(zhuǎn)為BKA。對(duì)于一些列建立索引代價(jià)太大，不好建立索引的情況，我們可以使用臨時(shí)表去優(yōu)化。

例如，對(duì)于這個(gè)語句：

select * from t1 join t2 on (t1.b=t2.b) where t2.b>=1 and t2.b<=2000;

使用臨時(shí)表的大致思路是：

把表t2中滿足條件的數(shù)據(jù)放在臨時(shí)表tmp_t中；為了讓join使用BKA算法，給臨時(shí)表tmp_t的字段b加上索引；讓表t1和tmp_t做join操作。

這樣可以大大減少掃描的行數(shù)，提升性能。

總結(jié)

在MySQL中，不管Join使用的是NLJ還是BNL總是應(yīng)該使用小表做驅(qū)動(dòng)表。更準(zhǔn)確地說，**在決定哪個(gè)表做驅(qū)動(dòng)表的時(shí)候，應(yīng)該是兩個(gè)表按照各自的條件過濾，過濾完成之后，計(jì)算參與join的各個(gè)字段的總數(shù)據(jù)量，數(shù)據(jù)量小的那個(gè)表，就是“小表”，應(yīng)該作為驅(qū)動(dòng)表。**應(yīng)當(dāng)盡量避免使用BNL算法，如果確認(rèn)優(yōu)化器會(huì)使用BNL算法，就需要做優(yōu)化。優(yōu)化的常見做法是，給被驅(qū)動(dòng)表的join字段加上索引，把BNL算法轉(zhuǎn)成BKA算法。對(duì)于不好在索引的情況，可以基于臨時(shí)表的改進(jìn)方案，提前過濾出小數(shù)據(jù)添加索引。

到此這篇關(guān)于MySQL中Join的算法(NLJ、BNL、BKA)詳解的文章就介紹到這了,更多相關(guān)MySQL中Join的算法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

mysql 帶多個(gè)條件的查詢方式
這篇文章主要介紹了mysql 帶多個(gè)條件的查詢方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2021-06-06
MySQL中大數(shù)據(jù)表增加字段的實(shí)現(xiàn)思路
最近遇到的一個(gè)問題，需要在一張將近1000萬數(shù)據(jù)量的表中添加加一個(gè)字段，但是直接添加會(huì)導(dǎo)致mysql 奔潰，所以需要利用其他的方法進(jìn)行添加，這篇文章主要給大家介紹了MySQL中大數(shù)據(jù)表增加字段的實(shí)現(xiàn)思路，需要的朋友可以參考借鑒。
2017-01-01
Mysql?exists用法小結(jié)
這篇文章主要介紹了Mysql?exists用法的的相關(guān)資料，幫助大家更好的理解和使用MySQL，感興趣的朋友可以了解下
2020-12-12
這篇文章主要給大家介紹了關(guān)于mysql索引使用率監(jiān)控技巧的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家學(xué)習(xí)或者使用mysql具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
2019-09-09

基于MySQL和Redis扣減庫存的實(shí)踐

本文主要介紹了基于MySQL和Redis扣減庫存的實(shí)踐，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

2023-05-05

Centos中安裝多個(gè)mysql數(shù)據(jù)的配置實(shí)例

最近因?yàn)閱挝豁?xiàng)目擴(kuò)充,需要在原線上數(shù)據(jù)庫服務(wù)器上加裝一個(gè)mysql實(shí)例(實(shí)際上就是從新編譯安裝一個(gè)非3306的自定義端口,不同目錄的mysql),研究了一天,終于順利搞定,這里把配置步驟發(fā)給大家,供大家學(xué)習(xí)使用

2014-04-04

mysql 5.7.16 zip包安裝配置方法圖文教程

這篇文章主要為大家分享了mysql 5.7.16 zip包安裝配置方法圖文教程，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下

2016-10-10

win10下mysql 8.0.16 winx64安裝配置方法圖文教程

這篇文章主要為大家詳細(xì)介紹了win10下mysql 8.0.16 winx64安裝配置方法圖文教程，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下

2019-05-05

解決mysql登錄錯(cuò)誤：''Access denied for user ''root''@''localhost''

這篇文章主要介紹了mysql登錄錯(cuò)誤：'Access denied for user 'root'@'localhost'，本文給出了操作過程及注意事項(xiàng),需要的朋友可以參考下

2019-11-11

MySQL中你可能忽略的COLLATION實(shí)例詳解

mysql的collation大致的意思就是字符序，這篇文章主要給大家介紹了關(guān)于MySQL中COLLATION的相關(guān)資料，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

2021-05-05

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

MySQL中Join的算法(NLJ、BNL、BKA)詳解

目錄

什么是Join

Index Nested-Loop Join

Block Nested-Loop Join

MRR & BKA

總結(jié)

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

MySQL中Join的算法(NLJ、BNL、BKA)詳解

目錄

什么是Join

Index Nested-Loop Join

Block Nested-Loop Join

MRR & BKA

總結(jié)

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

MySQL中Join的算法(NLJ、BNL、BKA)詳解