java接口性能優(yōu)化技巧
背景
我負(fù)責(zé)的系統(tǒng)在去年初就完成了功能上的建設(shè),然后開始進(jìn)入到推廣階段。隨著推廣的逐步深入,收到了很多好評(píng)的同時(shí)也收到了很多對(duì)性能的吐槽。
剛剛收到吐槽的時(shí)候,我們的心情是這樣的:
當(dāng)越來越多對(duì)性能的吐槽反饋到我們這里的時(shí)候,我們意識(shí)到,接口性能的問題的優(yōu)先級(jí)必須提高了。
然后我們就跟蹤了 1 周的接口性能監(jiān)控,這個(gè)時(shí)候我們的心情是這樣的:
有 20 多個(gè)慢接口,5 個(gè)接口響應(yīng)時(shí)間超過 5s,1 個(gè)超過 10s,其余的都在 2s 以上,穩(wěn)定性不足 99.8%。
作為一個(gè)優(yōu)秀的后端程序員,這個(gè)數(shù)據(jù)肯定是不能忍的,我們馬上就進(jìn)入了漫長(zhǎng)的接口優(yōu)化之路。本文就是對(duì)我們漫長(zhǎng)工作歷程的一個(gè)總結(jié)。
基于 Spring Boot + MyBatis Plus + Vue & Element 實(shí)現(xiàn)的后臺(tái)管理系統(tǒng) + 用戶小程序,支持 RBAC 動(dòng)態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能。
項(xiàng)目地址:github.com/YunaiV/ruoy…
哪些問題會(huì)引起接口性能問題
這個(gè)問題的答案非常多,需要根據(jù)自己的業(yè)務(wù)場(chǎng)景具體分析。
這里做一個(gè)不完全的總結(jié):
- 數(shù)據(jù)庫(kù)慢查詢
- 業(yè)務(wù)邏輯復(fù)雜
- 線程池設(shè)計(jì)不合理
- 鎖設(shè)計(jì)不合理
- 機(jī)器問題(fullGC,機(jī)器重啟,線程打滿)
- 萬金油解決方式
基于微服務(wù)的思想,構(gòu)建在 B2C 電商場(chǎng)景下的項(xiàng)目實(shí)戰(zhàn)。核心技術(shù)棧,是 Spring Boot + Dubbo 。未來,會(huì)重構(gòu)成 Spring Cloud Alibaba 。
項(xiàng)目地址:github.com/YunaiV/onem…
問題解決
慢查詢(基于 mysql)
①深度分頁(yè)
所謂的深度分頁(yè)問題,涉及到 mysql 分頁(yè)的原理。通常情況下,mysql 的分頁(yè)是這樣寫的:
select name,code from student limit 100,20
含義當(dāng)然就是從 student 表里查 100 到 120 這 20 條數(shù)據(jù),mysql 會(huì)把前 120 條數(shù)據(jù)都查出來,拋棄前 100 條,返回 20 條。
當(dāng)分頁(yè)所以深度不大的時(shí)候當(dāng)然沒問題,隨著分頁(yè)的深入,sql 可能會(huì)變成這樣:
select name,code from student limit 1000000,20
這個(gè)時(shí)候,mysql 會(huì)查出來 1000020 條數(shù)據(jù),拋棄 1000000 條,如此大的數(shù)據(jù)量,速度一定快不起來。
那如何解決呢?一般情況下,最好的方式是增加一個(gè)條件:
select name,code from student where id>1000000 limit 20
這樣,mysql 會(huì)走主鍵索引,直接連接到 1000000 處,然后查出來 20 條數(shù)據(jù)。但是這個(gè)方式需要接口的調(diào)用方配合改造,把上次查詢出來的最大 id 以參數(shù)的方式傳給接口提供方,會(huì)有溝通成本(調(diào)用方:老子不改?。?。
②未加索引
這個(gè)是最容易解決的問題,我們可以通過:
show create table xxxx(表名)
查看某張表的索引。具體加索引的語(yǔ)句網(wǎng)上太多了,不再贅述。不過順便提一嘴,加索引之前,需要考慮一下這個(gè)索引是不是有必要加,如果加索引的字段區(qū)分度非常低,那即使加了索引也不會(huì)生效。
另外,加索引的 alter 操作,可能引起鎖表,執(zhí)行 sql 的時(shí)候一定要在低峰期(血淚史?。。。。?/p>
③索引失效
這個(gè)是慢查詢最不好分析的情況,雖然 mysql 提供了 explain 來評(píng)估某個(gè) sql 的查詢性能,其中就有使用的索引。
但是為啥索引會(huì)失效呢?mysql 卻不會(huì)告訴咱,需要咱自己分析。大體上,可能引起索引失效的原因有這幾個(gè)(可能不完全):
需要特別提出的是,關(guān)于字段區(qū)分性很差的情況,在加索引的時(shí)候就應(yīng)該進(jìn)行評(píng)估。如果區(qū)分性很差,這個(gè)索引根本就沒必要加。
區(qū)分性很差是什么意思呢,舉幾個(gè)例子,比如:
- 某個(gè)字段只可能有 3 個(gè)值,那這個(gè)字段的索引區(qū)分度就很低。
- 再比如,某個(gè)字段大量為空,只有少量有值;
- 再比如,某個(gè)字段值非常集中,90% 都是 1,剩下 10% 可能是 2,3,4....
進(jìn)一步的,那如果不符合上面所有的索引失效的情況,但是 mysql 還是不使用對(duì)應(yīng)的索引,是為啥呢?
這個(gè)跟 mysql 的 sql 優(yōu)化有關(guān),mysql 會(huì)在 sql 優(yōu)化的時(shí)候自己選擇合適的索引,很可能是 mysql 自己的選擇算法算出來使用這個(gè)索引不會(huì)提升性能,所以就放棄了。
這種情況,可以使用 force index 關(guān)鍵字強(qiáng)制使用索引(建議修改前先實(shí)驗(yàn)一下,是不是真的會(huì)提升查詢效率):
select name,code from student force index(XXXXXX) where name = '天才'
其中 xxxx 是索引名。
④join 過多 or 子查詢過多
我把 join 過多和子查詢過多放在一起說了。一般來說,不建議使用子查詢,可以把子查詢改成 join 來優(yōu)化。同時(shí),join 關(guān)聯(lián)的表也不宜過多,一般來說 2-3 張表還是合適的。
具體關(guān)聯(lián)幾張表比較安全是需要具體問題具體分析的,如果各個(gè)表的數(shù)據(jù)量都很少,幾百條幾千條,那么關(guān)聯(lián)的表的可以適當(dāng)多一些,反之則需要少一些。
另外需要提到的是,在大多數(shù)情況下 join 是在內(nèi)存里做的,如果匹配的量比較小,或者 join_buffer 設(shè)置的比較大,速度也不會(huì)很慢。
但是,當(dāng) join 的數(shù)據(jù)量比較大的時(shí)候,mysql 會(huì)采用在硬盤上創(chuàng)建臨時(shí)表的方式進(jìn)行多張表的關(guān)聯(lián)匹配,這種顯然效率就極低,本來磁盤的 IO 就不快,還要關(guān)聯(lián)。
一般遇到這種情況的時(shí)候就建議從代碼層面進(jìn)行拆分,在業(yè)務(wù)層先查詢一張表的數(shù)據(jù),然后以關(guān)聯(lián)字段作為條件查詢關(guān)聯(lián)表形成 map,然后在業(yè)務(wù)層進(jìn)行數(shù)據(jù)的拼裝。
一般來說,索引建立正確的話,會(huì)比 join 快很多,畢竟內(nèi)存里拼接數(shù)據(jù)要比網(wǎng)絡(luò)傳輸和硬盤 IO 快得多。
⑤in 的元素過多
這種問題,如果只看代碼的話不太容易排查,最好結(jié)合監(jiān)控和數(shù)據(jù)庫(kù)日志一起分析。如果一個(gè)查詢有 in,in 的條件加了合適的索引,這個(gè)時(shí)候的 sql 還是比較慢就可以高度懷疑是 in 的元素過多。
一旦排查出來是這個(gè)問題,解決起來也比較容易,不過是把元素分個(gè)組,每組查一次。想再快的話,可以再引入多線程。
進(jìn)一步的,如果in的元素量大到一定程度還是快不起來,這種最好還是有個(gè)限制:
select id from student where id in (1,2,3 ...... 1000) limit 200
//當(dāng)然了,最好是在代碼層面做個(gè)限制: if (ids.size() > 200) { throw new Exception("單次查詢數(shù)據(jù)量不能超過200"); }
⑥單純的數(shù)據(jù)量過大
這種問題,單純代碼的修修補(bǔ)補(bǔ)一般就解決不了了,需要變動(dòng)整個(gè)的數(shù)據(jù)存儲(chǔ)架構(gòu)?;蛘呤菍?duì)底層 mysql 分表或分庫(kù)+分表;或者就是直接變更底層數(shù)據(jù)庫(kù),把 mysql 轉(zhuǎn)換成專門為處理大數(shù)據(jù)設(shè)計(jì)的數(shù)據(jù)庫(kù)。
這種工作是個(gè)系統(tǒng)工程,需要嚴(yán)密的調(diào)研、方案設(shè)計(jì)、方案評(píng)審、性能評(píng)估、開發(fā)、測(cè)試、聯(lián)調(diào),同時(shí)需要設(shè)計(jì)嚴(yán)密的數(shù)據(jù)遷移方案、回滾方案、降級(jí)措施、故障處理預(yù)案。
除了以上團(tuán)隊(duì)內(nèi)部的工作,還可能有跨系統(tǒng)溝通的工作,畢竟做了重大變更,下游系統(tǒng)的調(diào)用接口的方式有可能會(huì)需要變化。
出于篇幅的考慮,這個(gè)不再展開了,筆者有幸完整參與了一次億級(jí)別數(shù)據(jù)量的數(shù)據(jù)庫(kù)分表工作,對(duì)整個(gè)過程的復(fù)雜性深有體會(huì),后續(xù)有機(jī)會(huì)也會(huì)分享出來。
業(yè)務(wù)邏輯復(fù)雜
①循環(huán)調(diào)用
這種情況,一般都循環(huán)調(diào)用同一段代碼,每次循環(huán)的邏輯一致,前后不關(guān)聯(lián)。
比如說,我們要初始化一個(gè)列表,預(yù)置 12 個(gè)月的數(shù)據(jù)給前端:
List<Model> list = new ArrayList<>(); for(int i = 0 ; i < 12 ; i ++) { Model model = calOneMonthData(i); // 計(jì)算某個(gè)月的數(shù)據(jù),邏輯比較復(fù)雜,難以批量計(jì)算,效率也無法很高 list.add(model); }
這種顯然每個(gè)月的數(shù)據(jù)計(jì)算相互都是獨(dú)立的,我們完全可以采用多線程方式進(jìn)行:
// 建立一個(gè)線程池,注意要放在外面,不要每次執(zhí)行代碼就建立一個(gè),具體線程池的使用就不展開了 public static ExecutorService commonThreadPool = new ThreadPoolExecutor(5, 5, 300L, TimeUnit.SECONDS, new LinkedBlockingQueue<>(10), commonThreadFactory, new ThreadPoolExecutor.DiscardPolicy()); // 開始多線程調(diào)用 List<Future<Model>> futures = new ArrayList<>(); for(int i = 0 ; i < 12 ; i ++) { Future<Model> future = commonThreadPool.submit(() -> calOneMonthData(i);); futures.add(future); } // 獲取結(jié)果 List<Model> list = new ArrayList<>(); try { for (int i = 0 ; i < futures.size() ; i ++) { list.add(futures.get(i).get()); } } catch (Exception e) { LOGGER.error("出現(xiàn)錯(cuò)誤:", e); }
②順序調(diào)用
如果不是類似上面循環(huán)調(diào)用,而是一次次的順序調(diào)用,而且調(diào)用之間沒有結(jié)果上的依賴,那么也可以用多線程的方式進(jìn)行,例如:
代碼上看:
A a = doA(); B b = doB(); C c = doC(a, b); D d = doD(c); E e = doE(c); return doResult(d, e);
那么可用 CompletableFuture 解決:
CompletableFuture<A> futureA = CompletableFuture.supplyAsync(() -> doA()); CompletableFuture<B> futureB = CompletableFuture.supplyAsync(() -> doB()); CompletableFuture.allOf(futureA,futureB) // 等a b 兩個(gè)任務(wù)都執(zhí)行完成 C c = doC(futureA.join(), futureB.join()); CompletableFuture<D> futureD = CompletableFuture.supplyAsync(() -> doD(c)); CompletableFuture<E> futureE = CompletableFuture.supplyAsync(() -> doE(c)); CompletableFuture.allOf(futureD,futureE) // 等d e兩個(gè)任務(wù)都執(zhí)行完成 return doResult(futureD.join(),futureE.join());
這樣 A B 兩個(gè)邏輯可以并行執(zhí)行,D E 兩個(gè)邏輯可以并行執(zhí)行,最大執(zhí)行時(shí)間取決于哪個(gè)邏輯更慢。
線程池設(shè)計(jì)不合理
有的時(shí)候,即使我們使用了線程池讓任務(wù)并行處理,接口的執(zhí)行效率仍然不夠快,這種情況可能是怎么回事呢?
這種情況首先應(yīng)該懷疑是不是線程池設(shè)計(jì)的不合理。我覺得這里有必要回顧一下線程池的三個(gè)重要參數(shù):核心線程數(shù)、最大線程數(shù)、等待隊(duì)列。
這三個(gè)參數(shù)是怎么打配合的呢?當(dāng)線程池創(chuàng)建的時(shí)候,如果不預(yù)熱線程池,則線程池中線程為 0。當(dāng)有任務(wù)提交到線程池,則開始創(chuàng)建核心線程。
當(dāng)核心線程全部被占滿,如果再有任務(wù)到達(dá),則讓任務(wù)進(jìn)入等待隊(duì)列開始等待。
如果隊(duì)列也被占滿,則開始創(chuàng)建非核心線程運(yùn)行。
如果線程總數(shù)達(dá)到最大線程數(shù),還是有任務(wù)到達(dá),則開始根據(jù)線程池拋棄規(guī)則開始拋棄。
那么這個(gè)運(yùn)行原理與接口運(yùn)行時(shí)間有什么關(guān)系呢?
- 核心線程設(shè)置過小:核心線程設(shè)置過小則沒有達(dá)到并行的效果
- 線程池公用,別的業(yè)務(wù)的任務(wù)執(zhí)行時(shí)間太長(zhǎng),占用了核心線程,另一個(gè)業(yè)務(wù)的任務(wù)到達(dá)就直接進(jìn)入了等待隊(duì)列
- 任務(wù)太多,以至于占滿了線程池,大量任務(wù)在隊(duì)列中等待
在排查的時(shí)候,只要找到了問題出現(xiàn)的原因,那么解決方式也就清楚了,無非就是調(diào)整線程池參數(shù),按照業(yè)務(wù)拆分線程池等等。
鎖設(shè)計(jì)不合理
鎖設(shè)計(jì)不合理一般有兩種:鎖類型使用不合理 or 鎖過粗。
鎖類型使用不合理的典型場(chǎng)景就是讀寫鎖。也就是說,讀是可以共享的,但是讀的時(shí)候不能對(duì)共享變量寫;而在寫的時(shí)候,讀寫都不能進(jìn)行。
在可以加讀寫鎖的時(shí)候,如果我們加成了互斥鎖,那么在讀遠(yuǎn)遠(yuǎn)多于寫的場(chǎng)景下,效率會(huì)極大降低。
鎖過粗則是另一種常見的鎖設(shè)計(jì)不合理的情況,如果我們把鎖包裹的范圍過大,則加鎖時(shí)間會(huì)過長(zhǎng),例如:
public synchronized void doSome() { File f = calData(); uploadToS3(f); sendSuccessMessage(); }
這塊邏輯一共處理了三部分,計(jì)算、上傳結(jié)果、發(fā)送消息。顯然上傳結(jié)果和發(fā)送消息是完全可以不加鎖的,因?yàn)檫@個(gè)跟共享變量根本不沾邊。
因此完全可以改成:
public void doSome() { File f = null; synchronized(this) { f = calData(); } uploadToS3(f); sendSuccessMessage(); }
機(jī)器問題(fullGC,機(jī)器重啟,線程打滿)
造成這個(gè)問題的原因非常多,筆者就遇到了定時(shí)任務(wù)過大引起 fullGC,代碼存在線程泄露引起 RSS 內(nèi)存占用過高進(jìn)而引起機(jī)器重啟等待諸多原因。
需要結(jié)合各種監(jiān)控和具體場(chǎng)景具體分析,進(jìn)而進(jìn)行大事務(wù)拆分、重新規(guī)劃線程池等等工作。
萬金油解決方式
萬金油這個(gè)形容詞是從我們單位某位老師那里學(xué)來的,但是筆者覺得非常貼切。這些萬金油解決方式往往能解決大部分的接口緩慢的問題,而且也往往是我們解決接口效率問題的最終解決方案。
當(dāng)我們實(shí)在是沒有辦法排查出問題,或者實(shí)在是沒有優(yōu)化空間的時(shí)候,可以嘗試這種萬金油的方式。
①緩存
緩存是一種空間換取時(shí)間的解決方案,是在高性能存儲(chǔ)介質(zhì)上(例如:內(nèi)存、SSD 硬盤等)存儲(chǔ)一份數(shù)據(jù)備份。
當(dāng)有請(qǐng)求打到服務(wù)器的時(shí)候,優(yōu)先從緩存中讀取數(shù)據(jù)。如果讀取不到,則再?gòu)挠脖P或通過網(wǎng)絡(luò)獲取數(shù)據(jù)。
由于內(nèi)存或 SSD 相比硬盤或網(wǎng)絡(luò) IO 的效率高很多,則接口響應(yīng)速度會(huì)變快非常多。緩存適合于應(yīng)用在數(shù)據(jù)讀遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)寫,且數(shù)據(jù)變化不頻繁的場(chǎng)景中。
從技術(shù)選型上看,有這些:
- 簡(jiǎn)單的 map
- guava 等本地緩存工具包
- 緩存中間件:redis、tair 或 memcached
當(dāng)然,memcached 現(xiàn)在用的很少了,因?yàn)橄啾扔?redis 他不占優(yōu)勢(shì)。tair 則是阿里開發(fā)的一個(gè)分布式緩存中間件,他的優(yōu)勢(shì)是理論上可以在不停服的情況下,動(dòng)態(tài)擴(kuò)展存儲(chǔ)容量,適用于大數(shù)據(jù)量緩存存儲(chǔ)。
相比于單機(jī) redis 緩存當(dāng)然有優(yōu)勢(shì),而他與可擴(kuò)展 Redis 集群的對(duì)比則需要進(jìn)一步調(diào)研。
進(jìn)一步的,當(dāng)前緩存的模型一般都是 key-value 模型。如何設(shè)計(jì) key 以提高緩存的命中率是個(gè)大學(xué)問,好的 key 設(shè)計(jì)和壞的 key 設(shè)計(jì)所提升的性能差別非常大。
而且,key 設(shè)計(jì)是沒有一定之規(guī)的,需要結(jié)合具體的業(yè)務(wù)場(chǎng)景去分析。各個(gè)大公司分享出來的相關(guān)文章,緩存設(shè)計(jì)基本上是最大篇幅。
②回調(diào) or 反查
這種方式往往是業(yè)務(wù)上的解決方式,在訂單或者付款系統(tǒng)中應(yīng)用的比較多。
舉個(gè)例子:當(dāng)我們付款的時(shí)候,需要調(diào)用一個(gè)專門的付款系統(tǒng)接口,該系統(tǒng)經(jīng)過一系列驗(yàn)證、存儲(chǔ)工作后還要調(diào)用銀行接口以執(zhí)行付款。
由于付款這個(gè)動(dòng)作要求十分嚴(yán)謹(jǐn),銀行側(cè)接口執(zhí)行可能比較緩慢,進(jìn)而拖累整個(gè)付款接口性能。
這個(gè)時(shí)候我們就可以采用 fast success 的方式:當(dāng)必要的校驗(yàn)和存儲(chǔ)完成后,立即返回 success,同時(shí)告訴調(diào)用方一個(gè)中間態(tài)“付款中”。
而后調(diào)用銀行接口,當(dāng)獲得支付結(jié)果后再調(diào)用上游系統(tǒng)的回調(diào)接口返回付款的最終結(jié)果“成果”or“失敗”。這樣就可以異步執(zhí)行付款過程,提升付款接口效率。
當(dāng)然,為了防止多業(yè)務(wù)方接入的時(shí)候回調(diào)接口不統(tǒng)一,可以把結(jié)果拋進(jìn) kafka,讓調(diào)用方監(jiān)聽自己的結(jié)果。
以上就是java接口性能優(yōu)化技巧的詳細(xì)內(nèi)容,更多關(guān)于java接口性能優(yōu)化的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Spring Data JDBC介紹及實(shí)現(xiàn)代碼
這篇文章主要介紹了Spring Data JDBC介紹及實(shí)現(xiàn)代碼,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-09-09Spring?Security實(shí)現(xiàn)分布式系統(tǒng)授權(quán)方案詳解
這篇文章主要介紹了Spring?Security實(shí)現(xiàn)分布式系統(tǒng)授權(quán),本節(jié)完成注冊(cè)中心的搭建,注冊(cè)中心采用Eureka,本文通過示例代碼圖文相結(jié)合給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-02-02Java正則校驗(yàn)密碼至少包含字母數(shù)字特殊符號(hào)中的2種實(shí)例代碼
正則表達(dá)式驗(yàn)證密碼功能在項(xiàng)目中經(jīng)常被使用到,但是很多朋友還是不大會(huì)使用密碼正則表達(dá)式進(jìn)行驗(yàn)證,下面這篇文章主要給大家介紹了關(guān)于Java正則校驗(yàn)密碼至少包含字母數(shù)字特殊符號(hào)中2種的相關(guān)資料,需要的朋友可以參考下2022-08-08源碼分析Spring?中?@Qualifier?注解基本用法
這篇文章主要介紹了源碼分析Spring?中?@Qualifier?注解基本用法,在源碼分析的過程中,也?GET?到?Spring?許多新的玩法,感興趣的小伙伴趕緊去試試吧2023-08-08Java Math.round(),Math.ceil(),Math.floor()的區(qū)別詳解
這篇文章主要介紹了Java Math.round(),Math.ceil(),Math.floor()的區(qū)別詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08教你在?Java?中實(shí)現(xiàn)?Dijkstra?最短路算法的方法
這篇文章主要教你在?Java?中實(shí)現(xiàn)?Dijkstra?最短路算法的方法,在實(shí)現(xiàn)最短路算法之前需要先實(shí)現(xiàn)帶權(quán)有向圖,文章中給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-04-04SpringBoot整合MyBatis Plus實(shí)現(xiàn)基本CRUD與高級(jí)功能
Spring Boot是一款用于快速構(gòu)建Spring應(yīng)用程序的框架,而MyBatis Plus是MyBatis的增強(qiáng)工具,本文將詳細(xì)介紹如何在Spring Boot項(xiàng)目中整合MyBatis Plus,并展示其基本CRUD功能以及高級(jí)功能的實(shí)現(xiàn)方式,需要的朋友可以參考下2024-02-02