go語言程序cpu過高問題排查的方法詳解
一、前言
Go程序像C/C++一樣,如果開發(fā)編碼考慮不當,會出現(xiàn)cpu負載過高的性能問題。如果程序是線上環(huán)境或者特定場景下出現(xiàn)負載過高,問題不好復(fù)現(xiàn),則需要利用當前負載過高的進程進行調(diào)用棧分析。
C/C++中一般先通過top -d 1 -p $pid -H 命令查看負載過高的線程號(TID),然后使用gdb attach到該進程,通過thread info獲取線程信息,然后切換到對應(yīng)負載高的線程,輸入bt查看調(diào)用棧。
結(jié)合對應(yīng)代碼中的函數(shù),進一步分析。Go語言中方法也類似,我們將通過dlv來分析負載高的協(xié)程調(diào)用棧。
二、問題排查過程
2.1 通過top查看高cpu的進程pid
通過top -d 1,可以發(fā)現(xiàn)進程cava_smu(pid=11205)的cpu過高。
2.2 通過top查看高cpu的線程tid
通過上一步,我們確定了是pid=11205的cava_smu進程cpu過高,那么可以通過top -d 1 -p 11205 -H 來確認cpu過載的線程tid,如下圖所示:
通過以上操作,可以確認tid=11208,11212,11213三個線程的cpu過高。
2.3 通過dlv附加到進程,分析線程/協(xié)程cpu過載的堆棧
首先,如果生產(chǎn)環(huán)境沒有dlv,則可以拷貝對應(yīng)的dlv到/usr/local/bin下。
接著 dlv attach 11205,確認tid=11208的goroutine 序號,如下圖所示:
2.4 在dlv中切換到對應(yīng)高cpu協(xié)程,并查看堆棧
如下圖所示:
通過以上操作,可以確認業(yè)務(wù)底層的棧幀是第6→5幀,business.go:18行的disPatchTask ->business.go:168 行的dispatchIdleTeu方法相關(guān),查看對應(yīng)版本代碼如下:
代碼執(zhí)行到下圖中,dispatchIdleTeu返回了錯誤qferror.ErrNoTeu。
代碼執(zhí)行到下圖中,189行dispatchIdleTeu返回了錯誤qferror.ErrNoTeu,所以189 if的執(zhí)行語句192~212無法進入進行,而外層是一個for死循環(huán),則會造成該協(xié)程一直占用cpu,導(dǎo)致cpu過載。
修復(fù)方法可以是在for 循環(huán)內(nèi)增加sleep休眠,例如在214行處增加time.Sleep(200 * time.Millisecond),效果請自行驗證。
總結(jié)
到此這篇關(guān)于go語言程序cpu過高問題排查的文章就介紹到這了,更多相關(guān)go程序cpu過高排查內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Go語言調(diào)用ffmpeg-api實現(xiàn)音頻重采樣
最近對golang處理音視頻很感興趣,對golang音視頻常用庫goav進行了一番研究。自己寫了一個wav轉(zhuǎn)采樣率的功能。給大家分享一下,中間遇到了不少坑,解決的過程中還是蠻有意思的,希望大家能喜歡2022-12-12