Arm於舊金山舉辦的 Arm Everywhere 活動上,正式宣布跨越其35年來從未涉足實體晶片的業務邊界,與Meta共同開發並推出首款資料中心級處理器——Arm AGI CPU。此舉標誌著這家長期作為晶片IP授權供應商的英國企業,首度以完整實體晶片產品進入伺服器市場,並已獲得包括Meta、OpenAI、SAP及SK Telecom在內的多家重量級企業簽署採用合約。
打破35年慣例:Arm首款實體晶片正式亮相
Arm自1990年創立以來,始終以提供晶片架構IP授權及運算子系統為核心業務,從未直接生產或銷售實體晶片。此次推出的Arm AGI CPU,以Neoverse V3架構為基礎,結合先進高速通道設計,專為新一代代理式AI(Agentic AI)基礎設施的大規模部署需求量身規劃。
Arm表示,此次產品的推出,使其客戶的選擇更為多元,從自行客製化晶片、整合平台方案,到直接部署Arm設計的處理器,生態夥伴可依據自身需求選擇最適合的解決方案。儘管這是Arm的第一款實體晶片,仍延續Neoverse運算基礎,並獲得超過50家橫跨超大規模雲端、晶片、記憶體、網路、軟體及系統製造等領域的合作夥伴支持。
Meta為主要共同開發夥伴,多家科技巨頭相繼跟進
在此次合作架構中,Meta不僅是Arm AGI CPU的共同開發夥伴,同時也是主要客戶。Arm AGI CPU的設計與Meta自研的Meta Training and Inference Accelerator(MTIA)晶片協同運作,可在大規模AI系統中實現更高效率的工作排程,進一步強化AI訓練與推論的整體效能。
除Meta之外,Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、SAP以及SK Telecom等企業也已與Arm簽署採用合約。在系統整合商方面,永擎、聯想、廣達與Supermicro皆已開始接受搭載Arm AGI CPU的系統訂單,顯示市場對此產品的接受度相當廣泛。
技術規格:136核心、3nm製程、支援DDR5-8800
從技術規格來看,Arm AGI CPU採用3奈米製程,熱設計功耗(TDP)為300W,內建136個運行頻率達3.7GHz的Neoverse V3核心,每個核心配備2MB L2快取。在I/O規格方面,該處理器支援96條PCIe Gen 6通道及CXL 3.0記憶體擴展,並具備適用於未來晶片與加速器架構的AMBA CHI擴展介面。記憶體方面,每個晶片提供6GB的記憶體頻寬、最高6TB的容量,並支援DDR5-8800規格記憶體。
在系統整合層面,Arm展示了10OU雙節點刀鋒伺服器設計,每個刀鋒伺服器包含2顆Arm AGI CPU,各自擁有獨立的記憶體與I/O控制器,單一刀鋒伺服器可提供272個核心,並支援最高12條64GB DDR5記憶體。一個標準36kW風冷機架可裝載30個刀鋒伺服器,合計提供8,160個CPU核心。此外,Arm與Supermicro共同開發的200kW液冷設計,則可容納336顆Arm AGI CPU,提供高達45,000個核心的運算能力。
效能與效率:Arm宣稱每機架性能為x86的兩倍
Arm在其參考設計基礎上指出,Arm AGI CPU的每機架性能較x86架構高出2倍,且每GW AI資料中心可減少約100億美元的資本支出。Arm進一步說明,相較於x86伺服器因多核心競爭記憶體頻寬而導致持續效能受限的問題,Arm AGI CPU更高的記憶體頻寬有助於每個機架執行更多有效執行緒,而其架構基礎Neoverse V3亦在單執行緒能耗效能表現上優於傳統x86。
為加速Arm伺服器的市場普及,Arm同步規劃符合開放運算專案(OCP)與Arm System Ready規範的1OU雙節點參考設計,並將公開貢獻相關設計文件、配套韌體,以及系統架構規範、框架與適用於Arm架構系統的診斷驗證工具,以利整個生態系統的建立與擴展。Arm亦表示,後續產品將持續推進Neoverse CSS產品路線,確保以不同方式與Arm合作的資料中心客戶,皆能在平台架構與軟體相容性上保持一致。
常見問題
Arm AGI CPU是什麼?
Arm AGI CPU是Arm公司推出的首款實體資料中心級處理器,與Meta共同開發,基於Neoverse V3架構,採用3奈米製程,配備136個Neoverse V3核心,專為大規模代理式AI工作負載設計,支援DDR5-8800記憶體及CXL 3.0擴展。
哪些企業已宣布採用Arm AGI CPU?
目前已宣布採用的企業包括Meta、OpenAI、Cerebras、Cloudflare、F5、Positron、Rebellions、SAP及SK Telecom。系統整合商方面,永擎、聯想、廣達與Supermicro已開始接受相關系統訂單。
Arm AGI CPU的效能相較x86有何優勢?
根據Arm的說明,在其參考設計下,Arm AGI CPU每機架性能較x86高出2倍,且每GW AI資料中心可節省約100億美元資本支出。此外,其更高的記憶體頻寬可避免x86架構中多核心競爭記憶體的效能瓶頸,並在單執行緒能耗效能上表現更為出色。