如何恢復(fù)MySQL主從數(shù)據(jù)一致性
最近被告知,MySQL主從數(shù)據(jù)庫的數(shù)據(jù)不一致,猜測備庫在同步過程中出現(xiàn)了問題,于是,登上備庫,使用 mysql> show slave status\G查看,果然,備庫在insert語句中因違反主鍵約束,導(dǎo)致備庫停止了同步?,F(xiàn)在的問題很明確,就是如何恢復(fù)主從庫數(shù)據(jù)的一致性。
可選方案如下:
一、查看Master最新的Position,將其作為Slave復(fù)制的起點。
這種思路體現(xiàn)的是過去的不一致既往不咎,現(xiàn)在保持同步即可??雌饋?,這個思路和恢復(fù)主從庫數(shù)據(jù)的一致性的初衷有所違背,但這種方法,簡單,高效,在測試環(huán)境,對歷史數(shù)據(jù)要求不高的場景中可使用。
二、必須嚴格的恢復(fù)主從庫數(shù)據(jù)的一致性。
在這里,也有兩種思路:
1. 備份主庫數(shù)據(jù),并在從庫上恢復(fù),在歷史數(shù)據(jù)一致性的基礎(chǔ)上開啟同步,但這種方法比較麻煩,必須在主庫上執(zhí)行鎖表操作,阻止客戶端對于表數(shù)據(jù)的更新操作,而且在數(shù)據(jù)量大的情況下,備份也是個耗時的工程。其實,這種方法在實際生產(chǎn)環(huán)境中也很少用。
2. Skip掉相關(guān)錯誤
其實,這個說活不是很嚴謹,準備的說,是跳過相關(guān)的事務(wù)。在我今天這種情況下,就是skip掉因違反主鍵約束而失敗的insert語句。
如何跳過相關(guān)事務(wù)
一、停止slave服務(wù)
二、SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1;
三、開啟slave服務(wù)。
這里跳過的是一個事務(wù)。當然,也可以跳過多個事務(wù),但要謹慎,畢竟,你并不知道跳過的是什么事務(wù)。
建議:可反復(fù)執(zhí)行上述步驟,仔細查看導(dǎo)致從庫不能同步的語句。有的時候,阻止從庫的事務(wù)太多,這種方法就顯得略為低效。
可分析主庫日志的事務(wù),來確定SQL_SLAVE_SKIP_COUNTER的合適值。具體步驟如下:
1、在備庫中執(zhí)行show slave status\G,確認以下兩個參數(shù)
根據(jù)上述兩個參數(shù)的值,在主庫中查看當前阻礙從庫復(fù)制的事務(wù)以及之后的事務(wù)。
mysql> SHOW BINLOG EVENTS in 'mysql-bin.000217' from 673146776;
這個是查看日志文件mysql-bin.000217中事務(wù)ID為673146776后的所有事務(wù)。
當然,SHOW BINLOG EVENTS的用法還是相當靈活的,下述方式均可。
mysql> SHOW BINLOG EVENTS in 'mysql-bin.000217' from 673146776\G
mysql> SHOW BINLOG EVENTS in 'mysql-bin.000217' from 673146776 limit 10;
也可在主機環(huán)境下通過mysqlbinlog命令查看
如何查詢語句的執(zhí)行情況
在從庫跳過相關(guān)事務(wù),重新啟動Slave后,Slave_IO_Running,Slave_SQL_Running兩項均顯示“YES”,但Seconds_Behind_Master并沒有馬上下降,反而緩慢上升。
這時候,通過show processlist語句查看線程的執(zhí)行情況,發(fā)現(xiàn)第一條語句執(zhí)行時間太長,“State”列顯示“Sending data”。關(guān)于“Sending data”的含義,官方說明如下:
可見,該語句涉及了大量的磁盤讀。
為了進一步分析該語句的耗時分布,可設(shè)置profiling變量。步驟如下:
一、在查詢開始之前,設(shè)置set profiling=on;
二、在語句執(zhí)行完畢后,通過show profiles查看語句的Query_ID。
三、通過show profile for queryQuery_ID 查看語句的具體執(zhí)行情況。
最后也發(fā)現(xiàn),該語句在Sending data階段耗時過久。
總結(jié):
1. 在執(zhí)行stop slave的時候,stop slave命令被hang住了,在網(wǎng)上查詢了相關(guān)資料,可能與Slave中有長SQL或Locked的SQL執(zhí)行有關(guān),在這里,除show processlist外,最好不要執(zhí)行show slave status以及slave stop等slave相關(guān)命令。那么如何解決該問題呢?等待鎖定SlaveSQL的線程結(jié)束,或者重啟數(shù)據(jù)庫。我選擇了后者。
2. 在重啟備庫的過程中,還有段小插曲,在執(zhí)行start slave命令的時候,報如下錯誤:ERROR 1872 (HY000): Slave failed to initialize relay log info structure from the repository。網(wǎng)上很多資料都是推薦重新配置主從集群,這樣又回到了開頭的方案選擇部分了。奇怪的時,我關(guān)閉了從庫,重新啟動,又好了。而兩次啟動命令唯一的差別就是前一次啟動使用的是mysqld,后一次啟動使用的是mysqld_safe,而且多帶了一個--user參數(shù)。
以上就是恢復(fù)MySQL主從數(shù)據(jù)一致性的具體實現(xiàn)方法,希望對大家的學習有所幫助。
相關(guān)文章
淺析centos 7 mysql-8.0.19-1.el7.x86_64.rpm-bundle.tar
這篇文章主要介紹了centos 7 mysql-8.0.19-1.el7.x86_64.rpm-bundle.tar的相關(guān)知識,需要的朋友可以參考下2020-01-01Windows版mysql?8.0.28?安裝配置方法圖文教程
這篇文章主要為大家詳細介紹了Windows版mysql?8.0.28?安裝配置方法圖文教程,文中安裝步驟介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-06-06mysql_connect(): Connection using old (pre-4.1.1) authentica
MySQL錯誤提示:Connection using old (pre-4.1.1) authentication protocol refused (client option ‘secure_auth’ enabled)解決辦法,需要的朋友可以參考下2014-04-04解決Navicat遠程連接MySQL出現(xiàn) 10060 unknow error的方法
這篇文章主要介紹了解決Navicat遠程連接MySQL出現(xiàn) 10060 unknow error的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-12-12解決MySQL數(shù)據(jù)庫意外崩潰導(dǎo)致表數(shù)據(jù)文件損壞無法啟動的問題
這篇文章主要介紹了MySQL數(shù)據(jù)庫意外崩潰導(dǎo)致表數(shù)據(jù)文件損壞無法啟動的問題及解決方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-07-07Mysql中STR_TO_DATE函數(shù)使用(字符串轉(zhuǎn)為日期/時間值)
這篇文章主要給大家介紹了關(guān)于Mysql中STR_TO_DATE函數(shù)使用的相關(guān)資料,STR_TO_DATE函數(shù)的主要功能是字符串轉(zhuǎn)為日期/時間值,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下2022-09-09MySQL日期函數(shù)與時間函數(shù)匯總(MySQL 5.X)
這篇文章主要給大家介紹了關(guān)于MySQL 5.X日期函數(shù)與時間函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-12-12