亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

銳龍AI Max+395如何打破迷你主機(jī)性能極限! 極摩客EVO-X2桌面Mini AI工作站評(píng)測(cè)

  發(fā)布時(shí)間:2025-06-28 09:42:48   作者:佚名   我要評(píng)論
就在5月份,AMD就在官微上宣布,搭載AMD銳龍AI Max+ 395處理器的AI超算桌面中心—極摩客EVO-X2正式發(fā)布,相較于同處理器的RBG幻X 128G+1TB動(dòng)輒2.1萬的價(jià)格就便宜了不少,下面我們就來看看詳細(xì)測(cè)評(píng)

首先通過UL Procyon測(cè)試了Phi-3.5 4B、Mistral 7B、Llama 3.1 8B以及Llama 2 13B四款經(jīng)典大語言模型,生成速度分別達(dá)到了69.56 tokens/s、44.87 tokens/s、38.01 tokens/s以及25.45 tokens/s,速度非常快。另外值得一提的是,即便是RTX 5060筆記本電腦GPU,因?yàn)槠渥鳛楠?dú)立顯卡也只有可憐的8GB顯存,所以也無法正常運(yùn)行參數(shù)量較大的Llama 2大模型,而Radeon 8060S不僅成功運(yùn)行,且生成速度能夠達(dá)到25.45 tokens/s,日常應(yīng)用完全沒有問題。此時(shí),銳龍AI Max+ 395平臺(tái)的獨(dú)特優(yōu)勢(shì)就徹底顯現(xiàn)出來了。

接下來我們通過LM Studio進(jìn)行了15B及以下小參數(shù)量大語言模型和22B及以上大參數(shù)量大語言模型的測(cè)試。

首先在各類小參數(shù)量稠密大模型測(cè)試中可以看到,銳龍AI Max+ 395表現(xiàn)非常出色,憑借內(nèi)存分配帶來的超大顯存支持,即便是遇到BF16高精度的Mistral-small 24B以及Gemma 2 27B大模型,生成速度也分別達(dá)到了12.37 tokens/s和11.62 tokens/s,表現(xiàn)出色。而對(duì)于更高性能的DeepSeek R1 14B、Phi-4 15B,速度也能達(dá)到19.63 tokens/s和12.24 tokens/s;低精度的DeepSeek R1 7B生成速度更是達(dá)到了41.94 tokens/s,而DeepSeek R1 1.5B則達(dá)到了92.67 tokens/s,可見在面對(duì)小參數(shù)量大模型時(shí),銳龍AI Max+ 395無論是面對(duì)高精度模型還是低精度模型,都能提供足夠快的生成速度。

在面對(duì)大參數(shù)量大語言模型時(shí),其實(shí)首要解決的問題不是能不能使用大模型,而是能不能正常加載大模型。就比如RTX 5060筆記本電腦GPU,雖然其性能比Radeon 8060S要強(qiáng),但如果大模型參數(shù)量較大,前者大概率也過不了加載這一關(guān),更別提進(jìn)一步應(yīng)用了。

從下圖可以看到,我們?cè)诩虞dQwen3-235B-A22B-IQ2_S的MoE混合大模型時(shí),內(nèi)存峰值占用高達(dá)63.6GB,如果沒有128GB超大內(nèi)存支持的話,加載這一關(guān)就過不了。

在各類大參數(shù)量大語言模型測(cè)試中,Qwen3-235B-A22B-IQ2_SMoE模型生成速度達(dá)到了14.72 tokens/s,表現(xiàn)出色;DeepSeek IQ2_M、DeepSeek R1 Distill Llama 70B大參數(shù)量稠密模型也能夠正常運(yùn)行,并且可以達(dá)到4.91 tokens/s和5.31 tokens/s的生成速度。而Q4量化版本的DeepSeek R1 Qwen 32B蒸餾模型以及QWQ 32B大模型生成速度分別可以達(dá)到9.71 tokens/s和9.79 tokens/s的生成速度。

另外這里要說明的一點(diǎn)是,Qwen3-235B-A22B-IQ2_S這個(gè)模型雖然參數(shù)量達(dá)到了235B,但它并非是常見的稠密模型,而是MoE(Mixtureofexperts)混合專家模型。簡單來說,MoE模型雖然總參數(shù)量很大,但以Qwen3-235B-A22B-IQ2_S模型為例,它雖然擁有235B總參數(shù)量,但運(yùn)行時(shí)實(shí)際只會(huì)調(diào)用22B(模型中A22B標(biāo)識(shí)就表示運(yùn)行時(shí)只會(huì)調(diào)用22B參數(shù)量)的參數(shù)進(jìn)行計(jì)算,因此對(duì)于硬件的壓力要小很多。

也正是因?yàn)橛兄@種大參數(shù)、低算力特性,MoE模型或許會(huì)成為未來大模型發(fā)展的主流趨勢(shì)。

反之,稠密模型每一次計(jì)算都會(huì)調(diào)用所有參數(shù),這也就是為什么235B的Qwen3-235B-A22B-IQ2_S生成速度反而比DeepSeek R1 32B、QWQ 32B大模型要快的原因。

AI測(cè)試的最后一部分,我們使用了針對(duì)AMD銳龍平臺(tái)打造的Amuse這款Stable Diffusion工具,它支持文生圖、圖生圖、文生視頻等應(yīng)用,使用起來非常方便。

首先我們使用最近大半年非常火爆的FLUX.1-Dev模型進(jìn)行了文生圖測(cè)試,實(shí)測(cè)迭代10步,生成一張1024×1024超清圖片用時(shí)234.3秒。這個(gè)表現(xiàn)雖然不如獨(dú)顯,但在集成顯卡里,能順利完成這一任務(wù)的此前沒有,Radeon 8060S不僅順利完成,而且效率也還不錯(cuò),畢竟1024×1024規(guī)格的圖片生成,在AI文生圖應(yīng)用中算是高負(fù)載任務(wù)了。

其次我們使用了Stable Diffusion XL Turbo模型,進(jìn)行了2048x2048規(guī)格圖片的生成。這款大模型整體精度要低一些,所以對(duì)硬件負(fù)載的壓力不算太高。普通用戶使用這類大模型進(jìn)行文生圖就足夠了,沒必要使用FLUX.1-Dev這種超高精度大模型。

可以看到,Stable Diffusion XL Turbo模型生成2048x2048規(guī)格圖片耗時(shí)僅需12.8秒,每秒迭代次數(shù)也達(dá)到了2.6次。

總體來說,銳龍AI Max+ 395是非常不錯(cuò)的AI計(jì)算平臺(tái),配合大內(nèi)存并通過AMD統(tǒng)一內(nèi)存技術(shù)分配給顯存之后,常規(guī)的AI應(yīng)用基本沒有太大壓力,完全可以作為個(gè)人或者小型工作室、小型企業(yè)用戶的AI終端設(shè)備。尤其相比動(dòng)輒數(shù)萬、數(shù)十萬元的AI一體機(jī)來說,14999元的極摩客EVO-X2絕對(duì)是一個(gè)高性價(jià)比的解決方案。

同時(shí),這類設(shè)備也非常適合AI初學(xué)者、初級(jí)AI開發(fā)者使用。首先,銳龍AI Max+ 395平臺(tái)配合超大內(nèi)存,完全可以在本地部署多樣化的AI大模型,如70B、32B大語言模型,或者Flux、StableDiffusion等文生圖、文生視頻大模型。借助LMStudio、Comfy-UI等AI工具,輕松實(shí)現(xiàn)本地化的AI助手、個(gè)人知識(shí)庫以及圖片、視頻創(chuàng)作平臺(tái)的搭建。

其次,超大內(nèi)存與顯存帶來了更加出色的AI應(yīng)用體驗(yàn),例如用戶在實(shí)際應(yīng)用中可以同時(shí)加載Stable Diffusion+Whisper+Llama這樣的混合式AI模型方案,從而用AI解決AI應(yīng)用的問題,如讓AI直接生成提示詞,再通過SD進(jìn)行圖片、視頻創(chuàng)作。同時(shí)銳龍AI Max+395平臺(tái)還支持ONNX、DirectML等多種框架,完美適配Windows平臺(tái)的部署與運(yùn)行。因此也非常適合多模態(tài)AI應(yīng)用,如擴(kuò)圖、分割、語音識(shí)別、圖像識(shí)別等,節(jié)約實(shí)驗(yàn)或驗(yàn)證成本,快速完成Demo或開源項(xiàng)目的開發(fā)。

其三,設(shè)備成本支出更低的同時(shí),本地化部署帶來的另一大好處就是使用成本幾乎為零。用戶無需額外支付Token費(fèi)用,也不受網(wǎng)絡(luò)質(zhì)量影響。同時(shí)擁有更加可靠的用戶隱私、數(shù)據(jù)安全,算法模型數(shù)據(jù)不容易外泄。

此外,銳龍AI Max+ 395的NPU也可以參與YOLO等適配模型的相關(guān)任務(wù),分擔(dān)負(fù)載,從而讓多模態(tài)應(yīng)用擁有最優(yōu)的算力表現(xiàn)。

游戲性能評(píng)估

銳龍AI Max+ 395集成的Radeon 8060S本身擁有相當(dāng)不錯(cuò)的圖形性能,因此對(duì)于游戲玩家來說也是不錯(cuò)的選擇。所以性能測(cè)試的最后一部分,我們進(jìn)行了四款熱門游戲的測(cè)試。

  • 《三角洲行動(dòng)》,極高畫質(zhì)(次高畫質(zhì)),2560x1600分辨率,平均幀率可以達(dá)到96fps,流暢運(yùn)行無壓力。
  • 《荒野大鏢客2》,中等畫質(zhì),2560x1600分辨率,開啟FSR,平均幀率可以達(dá)到89fps,運(yùn)行非常流暢。
  • 《賽博朋克2077》,超級(jí)畫質(zhì),未開啟光追,2560x1600分辨率,平均幀率可以達(dá)到59.23fps,接近60fps的表現(xiàn)已經(jīng)遠(yuǎn)超當(dāng)前其它集成顯卡了。
  • 《黑神話:悟空》,超高畫質(zhì)(非影視級(jí)畫質(zhì)),2560x1600分辨率,平均幀率達(dá)到了62fps,可以流暢游玩。

可見極摩客EVO-X2不僅擁有出色的AI性能,同時(shí)還有著不錯(cuò)的游戲性能,再加上出色的生產(chǎn)力性能,這款產(chǎn)品可以說是相當(dāng)能打的一款綜合性迷你主機(jī)了。而且確實(shí)不負(fù)“桌面AI超算中心”之名!

相關(guān)文章

最新評(píng)論