Spyre 標志著大型主機的可靠性與前沿 AI 加速能力之間建立了實質(zhì)性橋梁,也為 AI 處理如何更貼近核心業(yè)務工作負載提供了思路。
架起 AI 與關(guān)鍵任務工作負載的橋梁
Spyre 加速器的開發(fā)目標是為與傳統(tǒng)企業(yè)應用并行運行的 AI 代理提供低延遲推理和實時響應能力。該芯片采用 5nm 工藝制造,集成 32 個加速核心和 256 億個晶體管,在實現(xiàn)高吞吐量的同時,仍能保持企業(yè)級的安全性和能源效率。
IBM 表示,客戶可在 IBM Z 或 LinuxONE 系統(tǒng)中集群部署最多 48 張 Spyre 加速卡,或在 Power11 服務器中部署 16 張,從而在本地提供可擴展的 AI 性能。IBM 指出,這種本地部署方式使客戶能夠在運行大規(guī)模生成式和代理式 AI 工作負載的同時,確保敏感數(shù)據(jù)的安全。
IBM 基礎設施首席運營官兼 IBM 系統(tǒng)總經(jīng)理巴里?貝克(Barry Baker)表示:“我們的核心優(yōu)先事項之一是推進基礎設施升級,以滿足新興 AI 工作負載的需求。借助 Spyre 加速器,我們正在擴展系統(tǒng)能力,以支持多模態(tài) AI—— 包括生成式和代理式 AI。這一創(chuàng)新使客戶能夠以無可妥協(xié)的安全性、彈性和效率擴展其支持 AI 的關(guān)鍵任務工作負載,同時釋放企業(yè)數(shù)據(jù)的價值?!?/p>
從研發(fā)到商業(yè)化的歷程
Spyre 的起源可追溯至 IBM 研究院 AI 硬件中心,其最初是作為探索節(jié)能 AI 計算的原型而設計。經(jīng)過多個開發(fā)周期和合作(包括與紐約州立大學奧爾巴尼分校新興人工智能系統(tǒng)中心的合作),該芯片已演進為適用于企業(yè)環(huán)境的量產(chǎn)級系統(tǒng)級芯片(SoC)。
IBM 半導體總經(jīng)理兼混合云副總裁Mukesh Khar表示:“我們于 2019 年成立 IBM 研究院 AI 硬件中心,目標是滿足 AI 不斷增長的計算需求 —— 甚至早于最近 LLM 和 AI 模型的爆發(fā)式發(fā)展。如今,在先進 AI 能力需求日益增長的背景下,我們很自豪地看到該中心的首款芯片進入商業(yè)化階段?!?/p>
讓企業(yè) AI 更貼近數(shù)據(jù)
對于大型主機用戶,Spyre 與 IBM 的 Telum II 處理器形成互補,為欺詐檢測、零售自動化和預測分析等應用提供近實時推理能力。在 IBM Power 系統(tǒng)上,Spyre 與 AI 服務目錄集成,支持一鍵安裝企業(yè) AI 工作流,為大規(guī)模生成式 AI 提供無縫的數(shù)據(jù)轉(zhuǎn)換和集成能力。
隨著 Spyre 的推出,IBM 正將自身定位為 AI 加速與企業(yè)基礎設施的交匯點,這標志著一個重要轉(zhuǎn)變:生成式 AI 不再僅存在于云端,而是越來越多地融入本地系統(tǒng)的核心 —— 這些系統(tǒng)正是關(guān)鍵業(yè)務數(shù)據(jù)的存儲之地。