佈局AI代理需求 阿里巴巴推新一代真武晶片超節點伺服器
阿里雲智能集團資深副總裁劉偉光表示,真武M890已應用於阿里雲磐久AL128號節點伺服器,相關佈局瞄準Agent(AI代理)時代的大規模併發推理需求。(圖/取自阿里旗下晶片公司「平頭哥」網站)
阿里巴巴旗下阿里雲20日在2026阿里雲峰會上,發佈新一代「平頭哥」訓推一體AI晶片真武M890與128卡超節點伺服器,並同步推出「Agentic Cloud」與新一代千問模型Qwen3.7-Max。阿里雲智能集團資深副總裁劉偉光說,真武M890已應用於阿里雲磐久AL128號節點伺服器,相關佈局瞄準Agent(AI代理)時代的大規模併發推理需求。
據阿里雲微信公衆號20日消息,新一代真武M890採用自研並行計算架構,內建144GB顯存,片間互聯頻寬達800GB/s,性能爲上一代真武810E的3倍,並支援FP32至FP4等多種數據精度,可對應高精度訓練與低精度推理等場景,配合自研ICN Switch 1.0晶片,可實現64卡全頻寬互聯。
第一財經指,阿里雲同步發佈基於真武M890的磐久AL128超節點伺服器,搭載ICN Switch 1.0,通訊時延低至百奈秒級,可讓128張AI晶片組成單一計算節點,以降低分散式運算中的通訊開銷,支援Agentic時代的大模型訓練與高併發推理需求。同時,平頭哥首次公佈真武系列後續規畫,預計2027年第三季推出真武V900、2028年第三季推出真武J900,加快晶片迭代。
IT之家提到,劉偉光說,「進入Agentic時代,阿里雲已全棧就緒」,從底層晶片、模型,到Agentic Cloud、模型服務與Agentic AI均已打通。他稱,現階段的Agentic AI已從過去「跑完業務流程」,轉向「交付結果」。
阿里雲還提出「Agentic Cloud」概念。阿里雲首席技術官李飛飛稱,傳統雲產品主要爲人類操作設計,但代理工作負載具有「無規律彈性、短生命週期、瞬時起量即走」等特徵,因此阿里雲已對雲產品進行Skill化、MCP化與CLI化改造,使Agent可直接調用雲端能力。
模型方面,阿里巴巴發佈新一代千問旗艦模型Qwen3.7-Max。阿里雲表示,該模型在第三方機構Arena全球大模型盲測總榜中位列大陸模型第一,並針對Agent場景提升編程、推理、多智能體協作與辦公自動化能力。
阿里巴巴通義大模型事業部負責人周靖人表示,大模型正從「對齊人類偏好」轉向「對齊任務目標」,過去追求模型「說得好」,現在則要求模型「做得到」。
此外,阿里雲稱,Qwen3.7-Max在未曾接觸過真武M890晶片的情況下,自主連續工作35小時,完成生產級AI計算內核的編寫與調優,性能較官方版本提升10倍。
據悉,目前真武系列AI晶片累計出貨56萬片,已服務中國電信、中國一汽、浦發銀行等20多個行業、超過400家客戶。快科技引述IDC數據稱,截至2026年第一季,真武PPU晶片累計出貨量已突破60萬片,在大陸AI晶片廠商中排名第二,僅次於華爲升騰。
阿里巴巴旗下阿里雲20日在2026阿里雲峰會上,發佈新一代「平頭哥」訓推一體AI晶片真武M890與128卡超節點伺服器,並同步推出「Agentic Cloud」與新一代千問模型Qwen3.7-Max。圖/取自阿里雲微信公衆號