數(shù)據(jù)結構-樹(三):多路搜索樹B樹、B+樹
多路搜索樹
- 完全二叉樹高度:O(log2N),其中2為對數(shù)
- 完全M路搜索樹的高度:O(logmN),其中M為對數(shù),樹每層的節(jié)點數(shù)
- M路搜索樹主要用于解決數(shù)據(jù)量大無法全部加載到內存的數(shù)據(jù)存儲。通過增加每層節(jié)點的個數(shù)和在每個節(jié)點存放更多的數(shù)據(jù)來在一層中存放更多的數(shù)據(jù),從而降低樹的高度,在數(shù)據(jù)查找時減少磁盤訪問次數(shù)。
- 所以每層的節(jié)點數(shù)和每個節(jié)點包含的關鍵字越多,則樹的高度越矮。但是在每個節(jié)點確定數(shù)據(jù)就越慢,但是B樹關注的是磁盤性能瓶頸,所以在單個節(jié)點搜索數(shù)據(jù)的開銷可以忽略。
B樹
B樹是一種M路搜索樹,B樹主要用于解決M路搜索樹的不平衡導致樹的高度變高,跟二叉樹退化為鏈表導致性能問題一樣。B樹通過對每層的節(jié)點進行控制、調整,如節(jié)點分離,節(jié)點合并,一層滿時向上分裂父節(jié)點來增加新的層等操作來來保證該M路搜索樹的平衡。具體規(guī)則如下:
- 根節(jié)點的兒子樹個數(shù)在2到M之間,其他非葉子節(jié)點的兒子樹個數(shù)在M/2和M之間。如果兒子樹個數(shù)因為分裂超過了M則此時需要向上遞歸分裂父節(jié)點,當找到一個不需要再分裂的父節(jié)點則停止分裂。該分裂過程直到根節(jié)點,如果需要分裂根節(jié)點,則會產生兩個根,故需要創(chuàng)建一個新的根來將這兩個根作為兒子節(jié)點,此時樹的高度會增加1。
- 每個非葉子節(jié)點的關鍵字的值從左到右依次變大,第i個關鍵字代表子樹i+1中的最小關鍵字;(其中對于根節(jié)點來說i在1到(2到M)之間,其他非葉子節(jié)點則是1到(M/2到M)之間);
- B樹的所有數(shù)據(jù)項都存放到葉子節(jié)點,非葉子節(jié)點不存放數(shù)據(jù),非葉子節(jié)點只存放用于指示搜索方向的關鍵字,即索引。這樣有利于將更多的非葉子節(jié)點加載到內存中,方便進行數(shù)據(jù)查找;
- 所有葉子節(jié)點都在相同的深度并且每個葉子節(jié)點包含L/2到L項數(shù)據(jù)。
M和L的大小選擇
- M為B樹的階數(shù)或者說是路數(shù)
- L為每個葉子節(jié)點最多存放的數(shù)據(jù)項個數(shù)
- 在B樹中,每個節(jié)點都是一個磁盤區(qū)塊,所以需要根據(jù)磁盤區(qū)塊的大小來決定M和L。
磁盤區(qū)塊大小與M的計算
- 每個非葉子節(jié)點存放了關鍵字和指向兒子樹的指針,具體數(shù)量為:M階的B樹,每個非葉子節(jié)點存放了M-1個關鍵字和M個指向兒子樹的指針,故加入每個關鍵字的大小為8字節(jié)(如Java的long類型就是8字節(jié)),每個指針為4字節(jié),則M階B樹的每個非一葉子節(jié)點需要:8 * (M-1) + 4 * M = 12M - 8個字節(jié)。
- 如果規(guī)定每個非葉子節(jié)點(磁盤區(qū)塊)占用內存不超過8K,即8192,則M最大為683,即683*12-8=8192。
葉子節(jié)點數(shù)據(jù)項個數(shù)L
- 假如每個數(shù)據(jù)項大小也是256字節(jié),則由于磁盤區(qū)塊大小為8K,即8192個字節(jié),而每個葉子節(jié)點可以存放L/2到L個數(shù)據(jù)項,所以每個葉子節(jié)點最多存放:8192/256=32個數(shù)據(jù)項,即L的大小為32。
- 一棵5階的B樹的結構如下,即M和L等于5:其中每個非葉子節(jié)點包含最多M-1=5-1=4個關鍵字,包含M,即5個指向子樹指針。L等于5,則每個葉子節(jié)點最多存放5個數(shù)據(jù)項。
B+樹
B+樹結構跟B樹基本一致,唯一的區(qū)別是B+樹的葉子節(jié)點之間通過指針相連形成一個鏈表,故便于遍歷所有的葉子節(jié)點,即獲取所有或者搜索關鍵字某一范圍的所有數(shù)據(jù)項。MySQL的InnoDB存儲引擎就是會用B+樹作為索引實現(xiàn)。
以上所述是小編給大家介紹的多路搜索樹B樹、B+樹詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關文章
MySQL InnoDB ReplicaSet(副本集)簡單介紹
這篇文章主要介紹了MySQL InnoDB ReplicaSet(副本集)的相關資料,幫助大家更好的理解和學習使用MySQL,感興趣的朋友可以了解下2021-04-04mysql報錯:1406 Data too long for colu
這篇文章給大家介紹了多種解決mysql報錯:1406, Data too long for column的解決方法,如果有遇到相同問題的朋友可以參考閱讀本文,對解決問題有一定的幫助,需要的朋友可以參考下2023-09-09MySql逗號分割的字段數(shù)據(jù)分解為多行代碼示例
逗號分割的字符串可以作為分組數(shù)據(jù)的標識符,用于對數(shù)據(jù)進行分組和聚合操作,下面這篇文章主要給大家介紹了關于MySql逗號分割的字段數(shù)據(jù)分解為多行的相關資料,需要的朋友可以參考下2023-12-12MySQL慢查詢之pt-query-digest分析慢查詢日志
這篇文章主要介紹了關于MySQL慢查詢之pt-query-digest分析慢查詢日志的相關資料,文中介紹的非常詳細,對大家具有一定的參考價值,需要的朋友們下面來一起看看吧。2017-03-03在MySQL中用正則表達式替換數(shù)據(jù)庫中的內容的方法
在MySQL中用正則表達式替換數(shù)據(jù)庫中的內容的方法...2007-03-03mysql中int、bigint、smallint 和 tinyint的區(qū)別詳細介紹
最近使用mysql數(shù)據(jù)庫的時候遇到了多種數(shù)字的類型,主要有int,bigint,smallint和tinyint;接下來將詳細介紹以上三種類型的應用2012-11-11