全球半導體IP巨擘Arm於3月24日,正式打破其長達三十多年的矽智財授權模式,歷史性推出首款由官方親自設計並量產的實體晶片——「Arm AGI CPU」。這款專為AI資料中心量身打造的處理器,劍指快速崛起的「代理式AI」(Agentic AI)基礎設施需求,並由科技巨頭Meta作為首發共同開發夥伴。憑藉台積電3奈米製程,Arm AGI CPU標榜能提供比傳統x86平台高出兩倍以上的機架運算效能,預計將重塑AI伺服器市場格局。
打破傳統模式:Arm為何親自下場製造晶片?
長久以來,Arm的核心商業模式是提供IP矽智財與運算子系統(CSS)授權,將晶片設計的最終生產交由合作夥伴。不過,隨著AI技術的爆炸性發展,運算需求正經歷前所未有的轉變,這也促使Arm做出這項意義深遠的戰略調整。Arm執行長Rene Haas早在去年便已證實將推出自有品牌晶片,並在本次活動中正式揭曉,其背後原因,正是對「代理式AI」所帶來的基礎設施變革的深刻洞察。
Rene Haas在聲明中指出,AI已徹底重新定義運算的建構與佈署方式。過去的AI基礎設施高度集中於GPU的「模型訓練」,但當AI應用轉向佈署持續運行的「AI代理」時,這些系統需要不斷進行推理、規劃、協調與資料搬移,導致AI系統生成的Token數量呈指數級增長。根據業界預估,當企業大規模導入代理驅動的應用時,每吉瓦(GW)電力所需的CPU數量將暴增超過4倍。在嚴苛的功耗限制下,傳統x86處理器複雜的架構與高能耗已難以負荷,這也為Arm提供了切入市場的絕佳契機。
為了協助合作夥伴加速佈署AI代理,Arm決定打破過往僅提供IP或CSS的「慣例」,直接推出自有品牌實體晶片。此舉不僅為市場提供更具彈性且直接的硬體選擇,更象徵Arm將從IP設計供應商,進一步跨足實體CPU產品領域,藉此在代理式AI趨勢中佈局更廣泛的運算市場。
AGI CPU技術亮點:台積電3奈米製程與極致效能
作為Arm首款實體晶片,AGI CPU在硬體規格與能效表現上展現了極強的企圖心,旨在為代理式AI提供無與倫比的運算能力。這款晶片由台積電以其先進的3奈米製程代工製造,確保了頂尖的功耗與效能表現。其核心技術規格包括:
- 頂尖核心與頻寬:單顆CPU搭載高達136個Arm Neoverse V3核心,並提供每核心6GB/s的記憶體頻寬,延遲表現更低於100奈秒(ns),確保資料處理的即時性與流暢度。
- 極致能效(TDP):功耗控制在300瓦(TDP),同時每個程式執行緒均配置專屬核心,確保在持續高負載下提供決定性的效能,有效消除降頻與閒置執行的浪費,對功耗敏感的AI資料中心來說,這無疑是一大福音。
- 超高機架密度:支援高密度1U伺服器機架,在氣冷佈署模式下,每組機架可容納高達8160個CPU核心;若採用液冷系統設計,則能推升至每機架對應超過45000個CPU核心,大幅提升資料中心的運算密度。
Arm強調,憑藉這些創新設計,AGI CPU每機架效能是傳統x86架構CPU的兩倍以上。這意味著在每吉瓦的AI資料中心建置中,將能為企業省下高達100億美元的資本支出,顯著降低AI基礎設施的建置與營運成本。對於尋求高效、節能AI運算方案的企業來說,AGI CPU提供了一個極具吸引力的替代選項。
產業巨頭力挺:Meta領銜合作夥伴生態圈
Arm親自投入晶片製造,並未引發原有IP客戶的強烈反彈,反而獲得了業界廣泛的支持。其中,Meta更是成為該晶片的首發合作夥伴與共同開發者,展現了對AGI CPU的高度認可與期待。Meta基礎設施主管Santosh Janardhan表示,Meta將利用Arm AGI CPU來優化其應用程式家族的基礎設施,並且將其與Meta自研的AI加速晶片「MTIA」協同運作,藉此實現在大規模AI系統中更有效率的運算調度。雙方也承諾將在未來多個世代的產品路線圖中持續深入合作。
「AI已經徹底重新定義了運算的建構與佈署方式。」Arm執行長Rene Haas強調,「隨著AI應用轉向佈署持續運行的AI代理,對運算效率與功耗的要求達到前所未有的高度,這正是Arm AGI CPU的用武之地。」
除了Meta,包含OpenAI、Cerebras、Cloudflare、SAP與SK Telecom在內的多家企業,也都確認將導入此晶片,用於加速器管理、控制平面處理,以及雲端API託管等核心任務。在硬體系統端,Arm已與華擎(ASRock Rack)、聯想(Lenovo)、廣達(Quanta Computer)及Supermicro等OEM及ODM廠展開合作,預計今年下半年將有更多搭載AGI CPU的系統投入市場。此外,AWS、Google、微軟、NVIDIA(執行長黃仁勳亦對此發表祝賀),以及三星、SK海力士(SK hynix)等超過50家科技巨頭,也對Arm擴展至晶片產品線表達大力支持,足見市場對此新策略的正面迴響。
展望與影響:代理式AI時代的運算版圖重塑
外界最初曾擔憂,Arm自行生產晶片是否會與AWS、Google或微軟這些已利用Arm架構自行開發CPU的大客戶產生利益衝突。然而,從目前來看,Arm將AGI CPU的定位精準切入「代理式AI」這個新興且需求孔急的特殊領域。對於像Meta或OpenAI這樣需要海量CPU來搭配自家AI加速器,卻又不見得想投入龐大資源去「從零設計通用CPU」的廠商來說,直接購買現成且已將Neoverse V3效能榨到極限的Arm AGI CPU,無疑是最具成本效益的務實做法。
話說回來,這也是Arm針對x86陣營(Intel與AMD)在資料中心領域發起的一場「絕殺」。當僅有300瓦熱設計功耗的Arm晶片,能透過台積電3奈米製程,在相同機架與電力限制下塞入136個核心,並且提供兩倍於x86架構CPU的效能時,x86架構在AI時代「功耗比過高」的致命傷將被進一步放大。這不僅象徵資料中心的運算主力正無可避免地向Arm架構全面傾斜,更預示著AI運算的新紀元,將由更高效、更具彈性的晶片解決方案所主導。