在 2025 年 OCP 全球峰會(huì)上,Arm 重點(diǎn)展示了一場(chǎng)變革:基于小芯片(Chiplet)的創(chuàng)新方案,通過 Arm 計(jì)算子系統(tǒng)(CSS)與小芯片系統(tǒng)架構(gòu)(CSA),為芯片供應(yīng)商打開了無(wú)需超大規(guī)模企業(yè)資源即可構(gòu)建 AI 優(yōu)化設(shè)計(jì)的大門。
從單體芯片到模塊化 AI 硅片
多年來,全定制 SoC 主導(dǎo)著 AI 基礎(chǔ)設(shè)施的高端市場(chǎng):從計(jì)算模塊到內(nèi)存控制器、互連結(jié)構(gòu)和加速器,全部集成在單一單核裸片上。這種設(shè)計(jì)雖提供了緊密控制和性能優(yōu)勢(shì),但也伴隨著沉重代價(jià):
隨著工藝節(jié)點(diǎn)逼近極限,功耗和散熱成本飆升;
大型異構(gòu)模塊的驗(yàn)證與確認(rèn)復(fù)雜度劇增;
設(shè)計(jì)、工具開發(fā)和制造的前置時(shí)間漫長(zhǎng)。
小芯片計(jì)算架構(gòu)的出現(xiàn)改變了這一局面。通過將系統(tǒng)分解為更小的專用裸片(計(jì)算、內(nèi)存、I/O、加速器等),SoC 架構(gòu)師和設(shè)計(jì)師得以混合搭配組件,僅對(duì)所需部分進(jìn)行擴(kuò)展,并加速迭代。但此前,這種模塊化面臨自身障礙:設(shè)計(jì)碎片化、缺乏標(biāo)準(zhǔn)化互連、IP 復(fù)用挑戰(zhàn),以及高昂的前期風(fēng)險(xiǎn)和成本。
破局之道:Arm 的 CSS 與 CSA 模型
Arm 通過兩大基礎(chǔ)框架填補(bǔ)了這些空白:
CSS(計(jì)算子系統(tǒng)):預(yù)驗(yàn)證的高性能 IP 構(gòu)建模塊(計(jì)算核心、AI 加速器、內(nèi)存子系統(tǒng)),其設(shè)計(jì)、驗(yàn)證和性能表現(xiàn)已在真實(shí)或仿真硅片中得到驗(yàn)證。使用 CSS 意味著設(shè)計(jì)者無(wú)需從零開發(fā)每個(gè)模塊或重復(fù)驗(yàn)證成熟功能,而是直接利用經(jīng)過優(yōu)化的現(xiàn)有組件。
CSA(小芯片系統(tǒng)架構(gòu)):一種開放的、基于標(biāo)準(zhǔn)的架構(gòu),定義了不同廠商小芯片的互連、通信和集成方式。CSA 在電氣、物理和協(xié)議層面確保兼容性,使來自不同來源的 IP(如合作伙伴 A 的加速器與代工廠 B 的內(nèi)存裸片)能在共享平臺(tái)上可靠互操作。
CSS 與 CSA 的結(jié)合,使 Socionext、聯(lián)發(fā)科等芯片供應(yīng)商能夠構(gòu)建定制化 AI 優(yōu)化芯片,性能可媲美超大規(guī)模企業(yè)設(shè)計(jì),同時(shí)具備更低風(fēng)險(xiǎn)、更快周期和更高靈活性。這些供應(yīng)商可根據(jù)視覺模型、推理引擎、多租戶實(shí)例等特定工作負(fù)載需求,自由選擇計(jì)算模塊、加速器、內(nèi)存類型和集成路徑,而非受限于單體設(shè)計(jì)的權(quán)衡。
OCP 加速行業(yè)變革的角色
開放計(jì)算項(xiàng)目(OCP)長(zhǎng)期以來是開放硬件協(xié)作、模塊化和效率的中心,這些原則與小芯片革命高度契合。在 2025 年 OCP 全球峰會(huì)上,Arm 不僅展示了理論架構(gòu),更通過實(shí)際案例演示了 CSS 與 CSA 組合如何被云服務(wù)提供商(CSP)、OEM 和芯片廠商用于構(gòu)建面向未來的 AI 基礎(chǔ)設(shè)施。
OCP 合作伙伴已看到的關(guān)鍵優(yōu)勢(shì)包括:
定制靈活性:針對(duì)特定區(qū)域的功耗、散熱或可靠性限制定制硅片;
降低總體擁有成本(TCO):通過供應(yīng)鏈多元化,可從多家代工廠采購(gòu)小芯片或裸片,隨規(guī)模擴(kuò)大混合搭配,而非依賴單一單體供應(yīng)商;
加速上市周期:預(yù)驗(yàn)證的 CSS 模塊和標(biāo)準(zhǔn)化互連省去大量設(shè)計(jì)工作,支持更快速的原型設(shè)計(jì)、測(cè)試和部署。
商業(yè)影響與未來展望
對(duì)于 AI 基礎(chǔ)設(shè)施構(gòu)建者(無(wú)論是 CSP、OEM 還是剛涉足 AI 領(lǐng)域的芯片企業(yè)),CSS 與 CSA 方案帶來切實(shí)價(jià)值:
能效比提升:計(jì)算和內(nèi)存被置于最高效的位置,避免資源浪費(fèi);
降低設(shè)計(jì)風(fēng)險(xiǎn):復(fù)用成熟 IP 并依賴標(biāo)準(zhǔn)互連;
供應(yīng)鏈彈性:模塊化使切換供應(yīng)商、擴(kuò)大裸片生產(chǎn)或選擇首選代工廠節(jié)點(diǎn)更可行;
速度優(yōu)勢(shì):設(shè)計(jì)周期縮短,支持 AI 模型、功能集和部署的更快迭代。
這不僅是硅片架構(gòu)的革新,更是 AI 時(shí)代敏捷商業(yè)的杠桿。
深入了解
在 2025 年 OCP 全球峰會(huì)上,Arm 將舉辦會(huì)議和技術(shù)簡(jiǎn)報(bào),展示 CSS 與 CSA 的實(shí)際應(yīng)用。無(wú)論您是芯片設(shè)計(jì)師、基礎(chǔ)設(shè)施架構(gòu)師還是探索 AI 硬件未來的云服務(wù)提供商,都可借此機(jī)會(huì)突破現(xiàn)有約束,探索更多可能。
如需深入了解推動(dòng)這一變革的工具和工作流程,可探索開發(fā)者如何使用 Arm Neoverse CSS V3 平臺(tái)加速流片前驗(yàn)證和固件開發(fā):
在 Arm Neoverse CSS V3 上開發(fā)和驗(yàn)證流片前固件
在 Neoverse RD-V3 上仿真 OpenBMC 和 UEFI 流片前環(huán)境
這些資源展示了在硅片進(jìn)入晶圓廠之前,早期軟件啟動(dòng)、固件驗(yàn)證和系統(tǒng)原型設(shè)計(jì)已如何實(shí)現(xiàn)。
Arm 的使命清晰可見:讓所有企業(yè)(而非僅超大規(guī)模企業(yè))都能獲得定制化 AI 硅片,因?yàn)閿?shù)據(jù)中心的未來取決于各規(guī)模企業(yè)的創(chuàng)新。