MyBatis實現(xiàn)Mysql數(shù)據(jù)庫分庫分表操作和總結(jié)(推薦)
前言
作為一個數(shù)據(jù)庫,作為數(shù)據(jù)庫中的一張表,隨著用戶的增多隨著時間的推移,總有一天,數(shù)據(jù)量會大到一個難以處理的地步。這時僅僅一張表的數(shù)據(jù)就已經(jīng)超過了千萬,無論是查詢還是修改,對于它的操作都會很耗時,這時就需要進(jìn)行數(shù)據(jù)庫切分的操作了。
MyBatis實現(xiàn)分表最簡單步驟
既然文章的標(biāo)題都這么寫了,不如直接上干貨來的比較實際,我們就先來看看如何實現(xiàn)最簡單的分表。
1、我們模擬用戶表數(shù)據(jù)量超過千萬(雖然實際不太可能)
2、用戶表原來的名字叫做user_tab
,我們切分為user_tab_0
和user_tab_1
(實際也可能不是這么隨意的名字),這樣就能把原來千萬的數(shù)據(jù)分離成兩個百萬的數(shù)據(jù)量的兩張表了。
3、如何操作這兩張表呢?我們利用userId也就是用戶的唯一標(biāo)識進(jìn)行區(qū)分。
4、userId%2 == 0
的用戶操作表user_tab_0
,同理userId%2 == 1
的用戶操作表user_tab_1
5、那么在MyBatis中sql語句如何實現(xiàn)呢?下面是舉例查詢一個用戶的sql語句
<select id="getUser" parameterType="java.util.Map" resultType="UserDO"> SELECT userId, name FROM user_tab_#{tabIndex} WHERE userId = #{userId} </select>
其中我們傳入了兩個參數(shù)tabIndex和userId,tabIndex就是需要操作表的標(biāo)示值(0或1),這樣如果需要查詢userId為5的用戶,那么最終出現(xiàn)的sql語句就會是:
SELECT userId, name FROM user_tab_1 WHERE userId = 5
其他多余的DAO服務(wù)和實現(xiàn)我這里就不多展示了,相信聰明的你肯定會的。
以上就是最簡單的實現(xiàn),不需要多余的框架,不需要任何的插件也就滿足了分表的要求。
上面基本上就是所有實現(xiàn)的內(nèi)容了,下面就要開始詳細(xì)說說分離的細(xì)節(jié)了,看熱鬧的基本可以散了。
我將從下面幾個角度分別來說說。我盡可能用最簡單的白話來說。
分離的方式
切分的方式主要有兩種,水平切分和垂直切分。
1、水平切分
簡單的說就是,把一張表分離成幾張一模一樣的表,然后表的名字不同。就和上面最簡單的例子一樣。
這種切分適合于一張表的數(shù)據(jù)量過大而導(dǎo)致操作時間變慢的情況,如保存的一些記錄表。
2、垂直切分
把不同的業(yè)務(wù)模塊分成不同的數(shù)據(jù)庫,這些業(yè)務(wù)模塊直接最好是0耦合(簡單的說就是毫無關(guān)系)。
這主要是適合數(shù)據(jù)量普遍較大,而且業(yè)務(wù)場景比較分散,互相之間沒有邏輯關(guān)系的情況。
分離的策略
具體的策略有很多種,你也可以設(shè)計你自己的,普遍的策略有下面幾種,只是列舉就不具體展開了。
1、“%”取模,也就是上面例子中實現(xiàn)的,也是最簡單的一種。
2、MD5哈希
3、移位
4、日期時間(根據(jù)不同的日期分表,如一個月一張表,這個月就操作這張表,下個月就下張表)
5、枚舉范圍(用戶1-10000操作第一張表,用戶10001-20000操作第二張表)
分離的問題
下面說說最終要的點,導(dǎo)致的問題。
數(shù)據(jù)庫肯定不是你說分就分的。(人家比較有感情的,怎么能說分就分呢?)
正經(jīng)來說,我列舉了下面幾個分離只有會導(dǎo)致的問題。
1、添加時主鍵唯一性的問題;分離之后多張表,就會導(dǎo)致原有的自增長主鍵不唯一,所以沒有辦法自增長了,導(dǎo)致問題,解決方案的也是有的,比如單獨維護(hù)一張主鍵表專門用來存放當(dāng)前主鍵,或者說用別的中間件等。
2、新增時的效率問題,雖然不是個大問題,但是新增肯定會多了計算量嘛,這個問題可以忽略不計。
3、查詢所帶來的分頁問題,分離成多張表之后,分頁查詢就很困難了,這也考慮到不同的分離用不同的解決方案,總之會產(chǎn)生問題。
4、同理,關(guān)聯(lián)查詢,原本一張表關(guān)聯(lián)別的表或者別的表關(guān)聯(lián)一張表,都很簡單,但是現(xiàn)在分離之后就難了。
5、事務(wù)問題,多張表需要使用分布式事務(wù)才能完成原來帶有事務(wù)的操作。因為原來的事務(wù)只是鎖一張表現(xiàn)在可能要鎖多張了呢。
6、擴(kuò)展性問題,有的切分策略下,對數(shù)據(jù)的擴(kuò)展性其實不好,之后如果有更多的數(shù)據(jù)來了,是說還能再新建表來擴(kuò)展嗎?
分離的原則
下面總結(jié)了幾點分離的原則,主要是參考了網(wǎng)絡(luò)上的,沒有任何實際的依據(jù)(我也不是個年薪百萬的DBA也碰不到那么大的數(shù)據(jù)去實際檢驗嘛),所以如果有任何問題也請指出。
1、能不分就不分
2、能分少就不分多
3、多冗余,不關(guān)聯(lián)
4、避免使用分布式事務(wù),主要是太難我也不會啊
5、單表千萬記錄以內(nèi)就不分
6、現(xiàn)在不分以后分也來得及
7、擴(kuò)展,耦合,仔細(xì)考慮
實現(xiàn)分離的方式
最后說說分離的方式,現(xiàn)在流行使用的DAO框架是MyBatis,也有很多別的框架。分離的實現(xiàn)主要有下面幾種方式。
1、原生實現(xiàn),就和最上面的例子一樣,不需要其他任何的東西,利用原生的框架,自己去控制實現(xiàn)。
優(yōu)點是:容易控制,掌握主動權(quán)。
缺點是:代碼量多,需要自己很清楚,修改不方便,不支持復(fù)雜的切分,比如切分之后還需要做一些分頁查詢,還有上面說的主鍵問題等。
2、插件實現(xiàn),利用框架本身開發(fā)的一些插件,去實現(xiàn)這些插件,然后利用插件去訪問數(shù)據(jù)庫,直接實現(xiàn)分離。
優(yōu)點是:代碼量少,實現(xiàn)簡單,擴(kuò)展性好。
缺點是:不易控制,分離方式有限,出現(xiàn)問題難以解決。沒有找到特別成熟的插件。
3、中間件實現(xiàn)。利用一些數(shù)據(jù)庫訪問的中間件,在訪問數(shù)據(jù)庫之前做一些操作使得sql進(jìn)行相應(yīng)的變化從而實現(xiàn)分離。
優(yōu)點是:耦合小,擴(kuò)展性好,可以解決分布式事務(wù)的問題。
確定是:實現(xiàn)比較復(fù)雜,需要對中間件進(jìn)行學(xué)習(xí),成本較大。維護(hù)也是一個大問題,萬一掛掉了。。
總之方式各有千秋,但是考慮到成本上面,第一種幾乎是0成本,即可上手,而且比較容易控制,就如同最上面給出的例子一樣,而且當(dāng)前我處理的數(shù)據(jù)還沒有到達(dá)那種處處要分離的地步,所以我選擇第一種。也推薦使用。如果你找到比較好用的插件或者中間件也可以在評論中推薦。
總結(jié)
在實際項目中,我是因為用戶的賬戶記錄過多所以不得不進(jìn)行分離,而且因為賬戶記錄更多的只是新增沒有修改和刪除,查詢也是少數(shù),所以使用了最簡單的方式進(jìn)行分離,也選擇了最簡單的策略。希望上面的原則策略方式和問題的總結(jié)能對你有所幫助,有所參考。如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
SpringBoot中優(yōu)化Undertow性能的方法總結(jié)
Undertow是一個采用 Java 開發(fā)的靈活的高性能Web服務(wù)器,提供包括阻塞和基于NIO的非堵塞機(jī)制,本文將給大家介紹SpringBoot中優(yōu)化Undertow性能的方法,文中有相關(guān)的代碼示例供大家參考,需要的朋友可以參考下2024-08-08SpringBoot 2.0 整合sharding-jdbc中間件實現(xiàn)數(shù)據(jù)分庫分表
這篇文章主要介紹了SpringBoot 2.0 整合sharding-jdbc中間件,實現(xiàn)數(shù)據(jù)分庫分表,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價值 ,需要的朋友可以參考下2019-06-06springboot @JsonSerialize的使用講解
這篇文章主要介紹了springboot @JsonSerialize的使用,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-10-10springboot編程式事務(wù)TransactionTemplate的使用說明
這篇文章主要介紹了springboot編程式事務(wù)TransactionTemplate的使用說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-06-06