java啟動參數(shù)之謎的排查過程
背景
最近遇到一個有意思的事情,java應(yīng)用運行在阿里云的ack集群中,某一天有個應(yīng)用啟動突然發(fā)現(xiàn)阿里云上的agent都沒有注冊了,于是開始排查原因。
排查過程
我們的應(yīng)用是java應(yīng)用,jdk版本是Open-jdk8,阿里云agent是直接注入到容器中的,因此會將agent啟動參數(shù)自動注入到 JAVA_TOOL_OPTIONS 環(huán)境變量中,當(dāng)應(yīng)用啟動時會自動帶上agent啟動參數(shù)。
agent沒注冊,首先檢查應(yīng)用的啟動日志,發(fā)現(xiàn)應(yīng)用是啟動成功的,tomcat端口都是正常的。仔細(xì)觀察日志,發(fā)現(xiàn)了問題。由于agent 啟動參數(shù)是注入到 JAVA_TOOL_OPTIONS 中的,通常jvm 在啟動的時候會優(yōu)先加載 JAVA_TOOL_OPTIONS,日志中會出現(xiàn) Picked up JAVA_TOOL_OPTIONS
的字樣,如下圖所示,但是問題現(xiàn)場卻沒有這一行和agent相關(guān)的啟動日志,說明 jvm 啟動的時候并沒有加載 JAVA_TOOL_OPTIONS。
我們開始懷疑是 agent啟動參數(shù) 的問題,以為是agent在容器重建時沒有將啟動參數(shù)注入到環(huán)境變量中。但是通過環(huán)境變量一看,發(fā)現(xiàn) JAVA_TOOL_OPTIONS 是在的,而且每個agent的參數(shù)都是齊全的。
這個時候就開始懷疑是不是啟動腳本的問題,是不是有人在啟動腳本中加了unset JAVA_TOOL_OPTIONS
,因為當(dāng)存在JAVA_TOOL_OPTIONS時,使用jdk相關(guān)的命令都會帶上JAVA_TOOL_OPTIONS中的參數(shù),造成一定的困擾,所以有時候在排查問題的時候會先unset掉這個變量,但是檢查完腳本也沒有問題。
最后開始咨詢阿里云的工程師,懷疑是不是agent或者容器環(huán)境有問題。經(jīng)過反復(fù)比較正常容器和問題容器的JAVA_TOOL_OPTIONS啟動參數(shù),發(fā)現(xiàn)問題容器因為多加載一個agent,JAVA_TOOL_OPTIONS多出來一段參數(shù),去掉這段參數(shù)就能恢復(fù)正常,加上就會有問題。到這里,可能正常的思路都是懷疑是多出來的參數(shù)造成的。但在排查其他正常容器時發(fā)現(xiàn),有的容器即使有這一段參數(shù)也能正常啟動。
這個時候,阿里云的工程師懷疑是不是參數(shù)太長導(dǎo)致的,因為有問題的容器的應(yīng)用名字比較長,于是我們開始測試,發(fā)現(xiàn)確實是這個問題,如下圖所示。隨后確定了問題所在,jdk8 在加載默認(rèn)環(huán)境變量時會檢查長度,當(dāng)大于1024字節(jié)時就會加載失敗。
環(huán)境變量
在jdk相關(guān)的環(huán)境變量中,有兩種默認(rèn)的環(huán)境變量 JAVA_TOOL_OPTIONS
和 _JAVA_OPTIONS
。
JAVA_TOOL_OPTIONS:在jdk8及之前版本中,該變量是最標(biāo)準(zhǔn)的,所有虛擬機(jī)都能識別和應(yīng)用的環(huán)境變量,在jdk9之后被JDK_JAVA_OPTIONS
所取代。該變量限制1024字節(jié),在不同虛擬機(jī)中表現(xiàn)不一樣,有的是加載失敗,有的是截取一段。
_JAVA_OPTIONS:也是默認(rèn)的環(huán)境變量,但是它是JVM廠家自定義的,可以覆蓋JAVA_TOOL_OPTIONS,但各廠家的命名不同,_JAVA_OPTIONS是Oracle的JVM,而IBM的則是用IBM_JAVA_OPTIONS。
因此為避免出現(xiàn)問題,我們應(yīng)該盡量避免使用默認(rèn)的環(huán)境變量,通常情況下可以在腳本中自定義啟動變量如 JAVA_OPTS
、SPRINGBOOT_OPTS
等等。然后在啟動java時顯式的指定啟動參數(shù)。
java [-options] -jar xxx.jar [args…] 可以寫成 JAVA_OPTS="[-options]" JAVA_ARGS="[args…]" java ${JAVA_OPTS} -jar xxx.jar ${JAVA_ARGS}
附:啟停腳本
項目打包后在測試環(huán)境的啟停都是個體力活,剛好又給筆者遇到了,綜合別人的腳本記錄了一下
判斷 Java 進(jìn)程是否存在
APP_NAME=xxx.jar pid=jps -l | grep $APP_NAME if [ -z $pid ]; then echo "$APP_NAME started" else echo "$APP_NAME stoped" fi # 普通進(jìn)程的 # pid=ps -ef | grep $APP_NAME | grep -v grep | awk '{print $2}'
啟停腳本
APP_NAME=xxxx-1.0-SNAPSHOT.jar pid=0 checkpid() { javaps=`jps -l | grep $APP_NAME` if [ -n "$javaps" ]; then pid=`echo $javaps | awk '{print $1}'` else pid=0 } start() { checkpid if [ $psid -ne 0 ]; then echo "$APP_NAME already started" else echo "Starting $APP_NAME ..." `nohup java -jar $APP_NAME > $APP_NAME'.out' 2>&1 &` checkpid if [ $pid -ne 0]; then echo "$APP_NAME start success" else echo "$APP_NAME start faild" fi fi } stop() { checkpid if [ $pid -ne 0 ]; then echo "Stoping $APP_NAME..." kill -9 $pid if [$? -eq 0 ]; then echo "$APP_NAME stop success" else echo "$APP_NAME stop faild" fi else echo "$APP_NAME already stoped" fi } case "$1" in 'start') start ;; 'stop') stop ;; 'restart') stop start ;; *) # 其他任何情況 echo "help: $0 {start|stop|restart}" echo "例子: ./deploy start exit 1 esac exit 0
總結(jié)
到此這篇關(guān)于java啟動參數(shù)之謎的文章就介紹到這了,更多相關(guān)java啟動參數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Eclipse中Properties和yml配置文件注釋亂碼的解決
這篇文章主要介紹了Eclipse中Properties和yml配置文件注釋亂碼的解決,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-10-10java中加密的實現(xiàn)方法(MD5,MD2,SHA)
這篇文章主要介紹了java中加密的實現(xiàn)方法(MD5,MD2,SHA)的相關(guān)資料,這里提供三種實現(xiàn)加密的方法,大家可以對比一下,需要的朋友可以參考下2017-08-08使用Java通過OAuth協(xié)議驗證發(fā)送微博的教程
這篇文章主要介紹了使用Java通過OAuth協(xié)議驗證發(fā)送微博的教程,使用到了新浪微博為Java開放的API weibo4j,需要的朋友可以參考下2016-02-02SpringBoot單元測試之?dāng)?shù)據(jù)隔離詳解
我們在寫單元測試時,有一個比較重要的要求是可以重復(fù)運行, 那么這樣就會有一個比較麻煩的問題:數(shù)據(jù)污染,所以本文為大家整理了兩個數(shù)據(jù)隔離的方式,希望對大家有所幫助2023-08-08spring+mybatis 通過@ResponseBody返回結(jié)果中文亂碼的解決方法
下面小編就為大家分享一篇spring+mybatis 通過@ResponseBody返回結(jié)果中文亂碼的解決方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2017-12-12