釋放 AI 潛能,Arm 計算平臺構建計算與存儲的未來

作者:Arm物聯(lián)網(wǎng)事部業(yè)務拓展副總裁 馬健

當下,我們正處在激動人心的人工智能(AI)技術變革初期階段。隨著自然語言、多模態(tài)大模型以及生成式AI技術的加速演進,AI正以前所未有的速度重塑各行各業(yè)。根據(jù)IDC的預測,全球數(shù)據(jù)量將從2024年的159.2ZB增長到2028年的超過384.6ZB,年復合增長率達24.4%。其中,到2028年,預計37%的數(shù)據(jù)將會在云端直接產(chǎn)生,而其余數(shù)據(jù)會從邊緣端和終端直接產(chǎn)生。

面對邊緣數(shù)據(jù)的激增,高效的數(shù)據(jù)處理、低延遲傳輸以及智能、安全的存儲正成為行業(yè)關注的重點。未來的計算架構不僅要提供更強的算力,還必須更緊密地與存儲系統(tǒng)結合,以確保AI模型能夠高效運行,同時優(yōu)化數(shù)據(jù)管理和訪問方式。

從目前的AI技術發(fā)展方向來看,一方面,大模型正向通用人工智能(AGI)演進,探索多模態(tài)、物理AI等新方向,并持續(xù)挑戰(zhàn)算力的新極限。另一方面,為推進大模型全面部署的進程,行業(yè)開始邁向深度優(yōu)化和垂直領域定制化,使大模型能走入千行百業(yè),適應移動端、邊緣計算、云端部署等不同場景。

DeepSeek的推出對全球AI市場產(chǎn)生了深遠影響:作為一種開放的創(chuàng)新技術,它不僅展示了AI在訓練與推理過程中的優(yōu)化潛力,還極大提高了大規(guī)模部署的效率,充分證明了模型能夠在更低成本、更高效能的環(huán)境中穩(wěn)定運行。這一成就對于推動AI在企業(yè)級應用和邊緣計算領域的大規(guī)模應用具有重要意義。

Arm計算平臺:持續(xù)促進從云到端的AI優(yōu)化部署

在AI發(fā)展的初期階段,數(shù)據(jù)中心作為模型訓練和初期推理的核心場所,正面臨著前所未有的挑戰(zhàn)。傳統(tǒng)的標準通用芯片在處理計算密集型的AI工作負載時顯得力不從心,無法滿足AI時代對于高性能、低功耗以及靈活擴展性的迫切需求。在此背景下,Arm計算平臺憑借其先進的技術優(yōu)勢,為新一代AI云基礎設施的發(fā)展開辟了新的范式。從Arm Neoverse計算子系統(tǒng)(CSS)、Arm Total Design生態(tài)項目到芯粒系統(tǒng)架構(CSA),Arm進行了從技術到生態(tài)的整體化布局,不僅為AI數(shù)據(jù)中心的工作負載提供了高效、靈活且可擴展的解決方案,還幫助合作伙伴專注于產(chǎn)品差異化,為產(chǎn)品上市進程提速。

AI推理是AI釋放價值的關鍵,它正迅速從云端拓展至邊緣端,覆蓋世界的每一個角落。在邊緣AI領域,Arm憑借其技術與生態(tài)的獨特優(yōu)勢,不斷創(chuàng)新,確保智能物聯(lián)網(wǎng)與消費電子生態(tài)系統(tǒng)能在恰當?shù)臅r機、于最適合的地點執(zhí)行最優(yōu)工作負載。

為了滿足邊緣AI日益攀升的AI工作負載需求,Arm近期發(fā)布了以全新Armv9超高能效CPU Cortex-A320以及對Transformer網(wǎng)絡具有原生支持的Ethos-U85 AI加速器為核心的邊緣AI計算平臺。該平臺實現(xiàn)了CPU與AI加速器的深度集成。相比去年以Cortex-M85搭配Ethos-U85的平臺提升了八倍的機器學習(ML)計算性能,帶來了顯著的AI計算能力突破,可賦能邊緣AI設備輕松運行超過10億參數(shù)的大模型。

釋放 AI 潛能,Arm 計算平臺構建計算與存儲的未來

圖:Arm邊緣AI計算平臺支持運行超10億參數(shù)的端側AI模型

其中,全新發(fā)布的超高能效Cortex-A320不僅可以為Ethos-U85提供更高的內(nèi)存容量與帶寬,讓大模型在Ethos-U85上的執(zhí)行如虎添翼,還支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問延遲。Cortex-A320與Ethos-U85的組合,是運行大模型及應對邊緣AI任務所帶來的內(nèi)存容量及帶寬挑戰(zhàn)的理想選擇。

此外,Cortex-A320還充分利用了Armv9增強的AI計算特性以及包括Secure EL2、指針驗證/分支目標識別(PACBTI)以及內(nèi)存標記擴展(MTE)等在內(nèi)的安全特性。此前,這些特性已經(jīng)在其他市場得到廣泛應用,而Arm現(xiàn)在將其引入了物聯(lián)網(wǎng)與邊緣AI計算領域,在提供出色且靈活AI性能的同時,實現(xiàn)對軟件負載更好的隔離與軟件內(nèi)存異常的防護,提高整體系統(tǒng)安全性。

AI時代的存儲發(fā)展:存儲、計算和安全能力的全面升級

隨著AI計算需求的持續(xù)增長,云邊端在對計算能力提出更高要求的同時,也對存儲系統(tǒng)的性能、密度、實時性和功耗等方面提出了更嚴苛的要求。在傳統(tǒng)模式下,計算架構往往將存儲和計算相對分離,存儲設備僅僅承擔數(shù)據(jù)存放的角色,數(shù)據(jù)需要在存儲與計算節(jié)點之間頻繁搬移,導致“存儲-計算”之間的瓶頸。然而在AI時代,為滿足數(shù)據(jù)實時分析、智能管理及高效訪問等需求,將存儲置于離計算單元更近的地方,或讓存儲本身具備計算能力,變得尤為關鍵。這樣能夠確保AI任務在最合適的位置得到高效執(zhí)行。

從云到端的AI計算,對存儲吞吐量、延遲、能耗、安全以及諸如Open Channel等提升主機可管理性(host manageability)的需求都不盡相同。存儲控制器以及運行在存儲控制器中Arm CPU上的固件在支持差異化AI存儲需求中起到了極其重要的作用。

釋放 AI 潛能,Arm 計算平臺構建計算與存儲的未來

圖:Arm豐富的IP平臺解決方案為AI存儲提供領先的性能及能效

事實上,作為數(shù)據(jù)存儲與網(wǎng)絡控制的基石,Arm一直在為全球存儲控制器和設備提供高性能、低功耗、安全可靠的解決方案,其中包括:

·Arm Cortex-R系列實時處理器擁有最快的中斷延時和實時反應速度,被廣泛應用于諸多存儲設備;

·Arm Cortex-M系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對獨特NAND介質(zhì)的深度優(yōu)化來創(chuàng)造差異;

·Arm Cortex-A系列應用處理器以高吞吐量流水線設計、支持最高處理性能,同時擁有ML、數(shù)據(jù)處理軟件和豐富操作系統(tǒng)的堅實生態(tài)支持;

·Arm Ethos-U AI加速器支持每秒2048MACs的Transformer原生加速,可以助力存儲控制器本身變得更智能;

·此外,還有為數(shù)據(jù)中心量身定制的Neoverse。我們已開始看到CXL(Compute Express Link)方面的創(chuàng)新設計采用Arm Coherent Mesh Network (CMN)與Neoverse組合實現(xiàn)可“組成式”內(nèi)存擴展,并融入近存儲計算的理念,減少數(shù)據(jù)搬運。

生態(tài)攜手,構建AI計算與存儲未來

在專注提供領先的技術和產(chǎn)品的同時,Arm還致力于和生態(tài)系統(tǒng)合作伙伴攜手共進,共同推動存儲產(chǎn)業(yè)的發(fā)展。基于Arm架構的平臺正被行業(yè)領先的存儲企業(yè)廣泛采用,以優(yōu)化其存儲解決方案。例如,Solidigm公司最新發(fā)布的122TB PCIe SSD Solidigm™ D5-P5336顯著提升了AI數(shù)據(jù)中心的能效、存儲密度和性能,其存儲控制器采用Arm Cortex-R CPU,有效提升了讀寫的實時性和延時確定性;慧榮科技(Silicon Motion)面向AI PC的SM2508主控芯片采用了Arm Cortex-R8與Cortex-M0,在能效和數(shù)據(jù)吞吐上實現(xiàn)了突破,其SM2264XT-AT是業(yè)界首款車用PCIe Gen4主控芯片,通過增強的虛擬化來支持混合關鍵性工作負載對數(shù)據(jù)的訪問,并可節(jié)省30%的能耗;江波龍基于Arm Cortex-R CPU打造的XP2300、ORCA 4836以及UNCIA 3836固態(tài)硬盤,憑借其大容量與高性能的優(yōu)勢,廣泛應用于AI PC、服務器、云計算、分布式存儲及邊緣計算等多個應用場景,滿足AI技術的本地化部署需求。

此外,在本土存儲市場,大普微、聯(lián)蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領先的存儲企業(yè),也都廣泛采用Arm技術打造SSD主控芯片與設備方案。

迄今為止,基于Arm架構和平臺所應用的存儲設備已近200億臺,其中包括云和企業(yè)級SSD、車載SSD、消費級SSD、硬盤驅(qū)動器和嵌入式閃存設備。目前,由Arm技術賦能的存儲設備持續(xù)保持在每日大約300萬臺的出貨量。

憑借前沿的技術實力、豐富的生態(tài)布局、深厚的存儲行業(yè)積累,Arm正繼續(xù)引領技術創(chuàng)新,賦能AI時代的計算與存儲發(fā)展。Arm也將繼續(xù)與合作伙伴攜手,通過安全、高效的Arm計算平臺,構建AI時代計算與存儲的新未來。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )