銳龍AI Max+395如何打破迷你主機(jī)性能極限! 極摩客EVO-X2桌面Mini AI工作站評(píng)測(cè)

發(fā)布時(shí)間：2025-06-28 09:42:48 作者：佚名

就在5月份，AMD就在官微上宣布，搭載AMD銳龍AI Max+ 395處理器的AI超算桌面中心—極摩客EVO-X2正式發(fā)布，相較于同處理器的RBG幻X 128G+1TB動(dòng)輒2.1萬的價(jià)格就便宜了不少，下面我們就來看看詳細(xì)測(cè)評(píng)

首先通過UL Procyon測(cè)試了Phi-3.5 4B、Mistral 7B、Llama 3.1 8B以及Llama 2 13B四款經(jīng)典大語言模型，生成速度分別達(dá)到了69.56 tokens/s、44.87 tokens/s、38.01 tokens/s以及25.45 tokens/s，速度非常快。另外值得一提的是，即便是RTX 5060筆記本電腦GPU，因?yàn)槠渥鳛楠?dú)立顯卡也只有可憐的8GB顯存，所以也無法正常運(yùn)行參數(shù)量較大的Llama 2大模型，而Radeon 8060S不僅成功運(yùn)行，且生成速度能夠達(dá)到25.45 tokens/s，日常應(yīng)用完全沒有問題。此時(shí)，銳龍AI Max+ 395平臺(tái)的獨(dú)特優(yōu)勢(shì)就徹底顯現(xiàn)出來了。

接下來我們通過LM Studio進(jìn)行了15B及以下小參數(shù)量大語言模型和22B及以上大參數(shù)量大語言模型的測(cè)試。

首先在各類小參數(shù)量稠密大模型測(cè)試中可以看到，銳龍AI Max+ 395表現(xiàn)非常出色，憑借內(nèi)存分配帶來的超大顯存支持，即便是遇到BF16高精度的Mistral-small 24B以及Gemma 2 27B大模型，生成速度也分別達(dá)到了12.37 tokens/s和11.62 tokens/s，表現(xiàn)出色。而對(duì)于更高性能的DeepSeek R1 14B、Phi-4 15B，速度也能達(dá)到19.63 tokens/s和12.24 tokens/s；低精度的DeepSeek R1 7B生成速度更是達(dá)到了41.94 tokens/s，而DeepSeek R1 1.5B則達(dá)到了92.67 tokens/s，可見在面對(duì)小參數(shù)量大模型時(shí)，銳龍AI Max+ 395無論是面對(duì)高精度模型還是低精度模型，都能提供足夠快的生成速度。

在面對(duì)大參數(shù)量大語言模型時(shí)，其實(shí)首要解決的問題不是能不能使用大模型，而是能不能正常加載大模型。就比如RTX 5060筆記本電腦GPU，雖然其性能比Radeon 8060S要強(qiáng)，但如果大模型參數(shù)量較大，前者大概率也過不了加載這一關(guān)，更別提進(jìn)一步應(yīng)用了。

從下圖可以看到，我們?cè)诩虞dQwen3-235B-A22B-IQ2_S的MoE混合大模型時(shí)，內(nèi)存峰值占用高達(dá)63.6GB，如果沒有128GB超大內(nèi)存支持的話，加載這一關(guān)就過不了。

在各類大參數(shù)量大語言模型測(cè)試中，Qwen3-235B-A22B-IQ2_SMoE模型生成速度達(dá)到了14.72 tokens/s，表現(xiàn)出色；DeepSeek IQ2_M、DeepSeek R1 Distill Llama 70B大參數(shù)量稠密模型也能夠正常運(yùn)行，并且可以達(dá)到4.91 tokens/s和5.31 tokens/s的生成速度。而Q4量化版本的DeepSeek R1 Qwen 32B蒸餾模型以及QWQ 32B大模型生成速度分別可以達(dá)到9.71 tokens/s和9.79 tokens/s的生成速度。

另外這里要說明的一點(diǎn)是，Qwen3-235B-A22B-IQ2_S這個(gè)模型雖然參數(shù)量達(dá)到了235B，但它并非是常見的稠密模型，而是MoE（Mixtureofexperts）混合專家模型。簡單來說，MoE模型雖然總參數(shù)量很大，但以Qwen3-235B-A22B-IQ2_S模型為例，它雖然擁有235B總參數(shù)量，但運(yùn)行時(shí)實(shí)際只會(huì)調(diào)用22B（模型中A22B標(biāo)識(shí)就表示運(yùn)行時(shí)只會(huì)調(diào)用22B參數(shù)量）的參數(shù)進(jìn)行計(jì)算，因此對(duì)于硬件的壓力要小很多。

也正是因?yàn)橛兄@種大參數(shù)、低算力特性，MoE模型或許會(huì)成為未來大模型發(fā)展的主流趨勢(shì)。

反之，稠密模型每一次計(jì)算都會(huì)調(diào)用所有參數(shù)，這也就是為什么235B的Qwen3-235B-A22B-IQ2_S生成速度反而比DeepSeek R1 32B、QWQ 32B大模型要快的原因。

AI測(cè)試的最后一部分，我們使用了針對(duì)AMD銳龍平臺(tái)打造的Amuse這款Stable Diffusion工具，它支持文生圖、圖生圖、文生視頻等應(yīng)用，使用起來非常方便。

首先我們使用最近大半年非常火爆的FLUX.1-Dev模型進(jìn)行了文生圖測(cè)試，實(shí)測(cè)迭代10步，生成一張1024×1024超清圖片用時(shí)234.3秒。這個(gè)表現(xiàn)雖然不如獨(dú)顯，但在集成顯卡里，能順利完成這一任務(wù)的此前沒有，Radeon 8060S不僅順利完成，而且效率也還不錯(cuò)，畢竟1024×1024規(guī)格的圖片生成，在AI文生圖應(yīng)用中算是高負(fù)載任務(wù)了。

其次我們使用了Stable Diffusion XL Turbo模型，進(jìn)行了2048x2048規(guī)格圖片的生成。這款大模型整體精度要低一些，所以對(duì)硬件負(fù)載的壓力不算太高。普通用戶使用這類大模型進(jìn)行文生圖就足夠了，沒必要使用FLUX.1-Dev這種超高精度大模型。

可以看到，Stable Diffusion XL Turbo模型生成2048x2048規(guī)格圖片耗時(shí)僅需12.8秒，每秒迭代次數(shù)也達(dá)到了2.6次。

總體來說，銳龍AI Max+ 395是非常不錯(cuò)的AI計(jì)算平臺(tái)，配合大內(nèi)存并通過AMD統(tǒng)一內(nèi)存技術(shù)分配給顯存之后，常規(guī)的AI應(yīng)用基本沒有太大壓力，完全可以作為個(gè)人或者小型工作室、小型企業(yè)用戶的AI終端設(shè)備。尤其相比動(dòng)輒數(shù)萬、數(shù)十萬元的AI一體機(jī)來說，14999元的極摩客EVO-X2絕對(duì)是一個(gè)高性價(jià)比的解決方案。

同時(shí)，這類設(shè)備也非常適合AI初學(xué)者、初級(jí)AI開發(fā)者使用。首先，銳龍AI Max+ 395平臺(tái)配合超大內(nèi)存，完全可以在本地部署多樣化的AI大模型，如70B、32B大語言模型，或者Flux、StableDiffusion等文生圖、文生視頻大模型。借助LMStudio、Comfy-UI等AI工具，輕松實(shí)現(xiàn)本地化的AI助手、個(gè)人知識(shí)庫以及圖片、視頻創(chuàng)作平臺(tái)的搭建。

其次，超大內(nèi)存與顯存帶來了更加出色的AI應(yīng)用體驗(yàn)，例如用戶在實(shí)際應(yīng)用中可以同時(shí)加載Stable Diffusion+Whisper+Llama這樣的混合式AI模型方案，從而用AI解決AI應(yīng)用的問題，如讓AI直接生成提示詞，再通過SD進(jìn)行圖片、視頻創(chuàng)作。同時(shí)銳龍AI Max+395平臺(tái)還支持ONNX、DirectML等多種框架，完美適配Windows平臺(tái)的部署與運(yùn)行。因此也非常適合多模態(tài)AI應(yīng)用，如擴(kuò)圖、分割、語音識(shí)別、圖像識(shí)別等，節(jié)約實(shí)驗(yàn)或驗(yàn)證成本，快速完成Demo或開源項(xiàng)目的開發(fā)。

其三，設(shè)備成本支出更低的同時(shí)，本地化部署帶來的另一大好處就是使用成本幾乎為零。用戶無需額外支付Token費(fèi)用，也不受網(wǎng)絡(luò)質(zhì)量影響。同時(shí)擁有更加可靠的用戶隱私、數(shù)據(jù)安全，算法模型數(shù)據(jù)不容易外泄。

此外，銳龍AI Max+ 395的NPU也可以參與YOLO等適配模型的相關(guān)任務(wù)，分擔(dān)負(fù)載，從而讓多模態(tài)應(yīng)用擁有最優(yōu)的算力表現(xiàn)。

游戲性能評(píng)估

銳龍AI Max+ 395集成的Radeon 8060S本身擁有相當(dāng)不錯(cuò)的圖形性能，因此對(duì)于游戲玩家來說也是不錯(cuò)的選擇。所以性能測(cè)試的最后一部分，我們進(jìn)行了四款熱門游戲的測(cè)試。

《三角洲行動(dòng)》，極高畫質(zhì)（次高畫質(zhì)），2560x1600分辨率，平均幀率可以達(dá)到96fps，流暢運(yùn)行無壓力。
《荒野大鏢客2》，中等畫質(zhì)，2560x1600分辨率，開啟FSR，平均幀率可以達(dá)到89fps，運(yùn)行非常流暢。
《賽博朋克2077》，超級(jí)畫質(zhì)，未開啟光追，2560x1600分辨率，平均幀率可以達(dá)到59.23fps，接近60fps的表現(xiàn)已經(jīng)遠(yuǎn)超當(dāng)前其它集成顯卡了。
《黑神話：悟空》，超高畫質(zhì)（非影視級(jí)畫質(zhì)），2560x1600分辨率，平均幀率達(dá)到了62fps，可以流暢游玩。

可見極摩客EVO-X2不僅擁有出色的AI性能，同時(shí)還有著不錯(cuò)的游戲性能，再加上出色的生產(chǎn)力性能，這款產(chǎn)品可以說是相當(dāng)能打的一款綜合性迷你主機(jī)了。而且確實(shí)不負(fù)“桌面AI超算中心”之名！