華為云發(fā)布 CloudMatrix 384 超節(jié)點(diǎn),硅基流動(dòng)宣布上線(xiàn)對(duì)應(yīng) DeepSeek-R1
IT之家 4 月 10 日消息,在今日舉行的華為云生態(tài)大會(huì) 2025 上,華為常務(wù)董事、華為云計(jì)算 CEO 張平安公布了 AI 基礎(chǔ)設(shè)施架構(gòu)進(jìn)展,推出 CloudMatrix 384 超節(jié)點(diǎn),并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線(xiàn)。

據(jù)介紹,華為云 CloudMatrix 384 超節(jié)點(diǎn)可實(shí)現(xiàn)從服務(wù)器級(jí)到矩陣級(jí)的資源供給模式轉(zhuǎn)變,具備“高密”“高速”“高效”的特點(diǎn),通過(guò)架構(gòu)創(chuàng)新,在算力、互聯(lián)帶寬、內(nèi)存帶寬等方面實(shí)現(xiàn)領(lǐng)先。
華為云還表示,對(duì)昇騰 AI 云服務(wù)進(jìn)行持續(xù)優(yōu)化,目前其已全面適配包含 DeepSeek 在內(nèi)的 160 多個(gè)第三方大模型,為大模型訓(xùn)推提供可靠保障,支撐行業(yè)應(yīng)用快速落地。此外,華為云盤(pán)古大模型已在 30 多個(gè)行業(yè)、400 多個(gè)場(chǎng)景中落地,在城市治理、智慧金融、醫(yī)療健康、氣象預(yù)測(cè)等領(lǐng)域廣泛應(yīng)用。

IT之家注意到,硅基流動(dòng)今日也宣布聯(lián)合華為云基于 CloudMatrix 384 超節(jié)點(diǎn)昇騰云服務(wù)和高性能推理框架 SiliconLLM ,用大規(guī)模專(zhuān)家并行最佳實(shí)踐正式上線(xiàn) DeepSeek-R1。
硅基流動(dòng)介紹稱(chēng),該服務(wù)在保證單用戶(hù) 20 TPS 水平前提下,單卡 Decode 吞吐突破 1920 Tokens / s,可比肩 H100 部署性能。同時(shí),經(jīng)過(guò)主流測(cè)試集驗(yàn)證及大規(guī)模線(xiàn)上盲測(cè),在昇騰算力部署 DeepSeek-R1 的模型精度與 DeepSeek 官方保持一致。
來(lái)源:IT之家