快捷導(dǎo)航

淺析MySQL并行復(fù)制

更新時間：2020年11月06日 14:10:59 作者：AsiaYe

這篇文章主要介紹了MySQL并行復(fù)制的相關(guān)資料，幫助大家更好的理解和使用MySQL數(shù)據(jù)庫，感興趣的朋友可以了解下

01 并行復(fù)制的概念

在MySQL的主從復(fù)制架構(gòu)中，主庫上經(jīng)常會并發(fā)的執(zhí)行很多SQL，只要這些SQL沒有產(chǎn)生鎖等待，那么同一時間并發(fā)好幾個SQL線程是沒有問題的。

我們知道，MySQL的從庫是要通過IO_thread去拉取主庫上的binlog的，然后存入本地，落盤成relay-log，通過sql_thread來應(yīng)用這些relay-log。

在MySQL5.6之前的版本中，當(dāng)主庫上有多個線程并發(fā)執(zhí)行SQL時，sql_thread只有一個，在某些TPS比較高的場景下，會出現(xiàn)主庫嚴(yán)重延遲的問題。MySQL為了解決這個問題，將sql_thread演化了多個worker的形式，在slave端并行應(yīng)用relay log中的事務(wù)，從而提高relay log的應(yīng)用速度，減少復(fù)制延遲。這就是并行復(fù)制的由來。

在MySQL中，復(fù)制線程是由參數(shù)slave_parallel_workers來控制的，通常情況下，在8G內(nèi)存、8核CPU的機器上，將該值設(shè)置為8比較合適，如果你的CPU核數(shù)比較高，那么可以適當(dāng)調(diào)整為8~16之間的數(shù)字。

mysql> show variables like 'slave_parallel_workers';
+------------------------+-------+
| Variable_name     | Value |
+------------------------+-------+
| slave_parallel_workers | 8   |
+------------------------+-------+
1 row in set, 1 warning (0.00 sec)

02 并行復(fù)制的演進

并行復(fù)制的本質(zhì)是同時執(zhí)行的SQL不存在鎖爭用。

在MySQL5.6版本，MySQL支持的粒度是按照數(shù)據(jù)庫進行并行執(zhí)行relay log，這種方式能夠解決一部分問題，因為不同數(shù)據(jù)庫上的SQL，肯定不會修改表中的同一行內(nèi)容。這樣也就不會產(chǎn)生鎖爭用。在一些數(shù)據(jù)庫均勻分布，每個數(shù)據(jù)庫使用頻率都差不多的場景下，這種并行復(fù)制的方法比較好。如果你的業(yè)務(wù)的數(shù)據(jù)都集中在一個熱點表，這種情況下，并行復(fù)制會退化為單線程復(fù)制。

隨后，在MariaDB中對并行復(fù)制做了一定的改進，它的做法是：

1、主庫上能夠并行提交的事務(wù)，也就是已經(jīng)進入到了redo log commit階段的事務(wù)，在從庫上也一定能夠并行提交，所以在主庫上并行提交的事務(wù)，它用一個commit_id對這組事務(wù)來進行標(biāo)識，下一組并行事務(wù)的commit_id為本組的commit_id+1

2、將所有的事務(wù)的commit_id寫入binlog中

3、在從庫上應(yīng)用binlog的時候，將所有的binlog按照commit_id進行劃分到不同的worker上

4、本組commit_id的事務(wù)全部在從庫上提交完成之后，再去拿下一批事務(wù)。

這種方法大大增加了從庫應(yīng)用relay log的速度，但是問題是從庫在應(yīng)用前一組事務(wù)的時候，后一組事務(wù)是處于等待中的，即使前一組的worker有些已經(jīng)空閑。而在主庫上，可能無時無刻不在寫入，這樣，系統(tǒng)的吞吐量上主從節(jié)點就不匹配，主庫的吞吐量嚴(yán)重高于從庫。

MySQL5.7的并行復(fù)制在MariaDB的基礎(chǔ)上做了改進，我們知道，事務(wù)進入到redo log prepare階段的時候，由于WAL技術(shù)，說明此時事務(wù)已經(jīng)經(jīng)過了所沖突檢測階段了。MySQL5.7的并行復(fù)制時將所有在主庫上處于redo log prepare階段的事務(wù)，和該階段之后的事務(wù)，也就是處于redo log commit階段的事務(wù)，在從庫并行執(zhí)行，從而減少worker線程不必要的等待。

這里，有必要再說兩個參數(shù)，

binnlog_group_commit_sync_delay參數(shù)，表示redo log prepare階段完成之后，延遲多少微秒后才調(diào)用fsync;
binlog_group_commit_sync_no_delay_count參數(shù)，表示累積多少次redo log prepare：write的操作以后才調(diào)用fsync

這兩個參數(shù)是用于故意拉長binlog從write到fsync的時間，以此減少binlog的寫盤次數(shù)。在MySQL 5.7的并行復(fù)制策略里，它們可以用來制造更多的“同時處于prepare階段的事務(wù)”。這樣就增加了備庫復(fù)制的并行度。

它們既可以“故意”讓主庫提交得慢些，又可以讓備庫執(zhí)行得快些。在MySQL 5.7處理備庫延遲的時候，可以考慮調(diào)整這兩個參數(shù)值，來達到提升備庫復(fù)制并發(fā)度的目的。

以上就是淺析MySQL并行復(fù)制的詳細內(nèi)容，更多關(guān)于MySQL并行復(fù)制的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: