英偉達(dá)AI-RAN最新動(dòng)作:輕量化解決方案ARC-Compact登場(chǎng)

北京時(shí)間5月21日消息(岳明)Light Reading在一篇最新報(bào)道中針對(duì)英偉達(dá)ARC-Compact的推出與潛在市場(chǎng)影響進(jìn)行了分析。

盡管市場(chǎng)反響有限,英偉達(dá)仍未放棄向電信行業(yè)銷(xiāo)售AI芯片的嘗試。不過(guò)這家GPU巨頭似乎正在轉(zhuǎn)向中低端市場(chǎng),并在最新推出的RAN解決方案中弱化了對(duì)AI的強(qiáng)調(diào)。如果說(shuō)以著名計(jì)算機(jī)奇才兼海軍少將命名的Grace Hopper芯片組是一艘豪華超級(jí)游艇,那么近日發(fā)布的ARC-Compact則像是一艘配置簡(jiǎn)化、功能精簡(jiǎn)的經(jīng)濟(jì)型船只。

去年發(fā)布的搭載Grace Hopper及后續(xù)Grace Blackwell的ARC服務(wù)器主要面向部署集中式RAN(C-RAN)的電信運(yùn)營(yíng)商,旨在通過(guò)就近數(shù)據(jù)中心支撐多基站運(yùn)行。而全新推出的ARC-Compact專(zhuān)為分布式RAN(D-RAN)基站部署設(shè)計(jì),這一架構(gòu)轉(zhuǎn)變將完全改變技術(shù)需求與經(jīng)濟(jì)模型。

圖:英偉達(dá)ARC-Compact產(chǎn)品圖。

ARC-Compact的核心組件是基于軟銀旗下Arm架構(gòu)的Grace CPU及L4 Tensor Core GPU。相較于Hopper和Blackwell GPU,該解決方案更加輕量級(jí),適用于一些邊緣視頻處理及推理任務(wù),但無(wú)法勝任大語(yǔ)言模型訓(xùn)練或高強(qiáng)度AI運(yùn)算。

在官方技術(shù)博客中,英偉達(dá)將ARC-Compact描述為“高性價(jià)比、高能效”的解決方案,適用于“低時(shí)延AI工作負(fù)載與RAN加速”。但即便L4 Tensor Core的配置也可能超出實(shí)際需求。當(dāng)前市場(chǎng)競(jìng)爭(zhēng)有限,僅有三家RAN設(shè)備商可能采用該技術(shù),且其關(guān)注重點(diǎn)更傾向于Grace CPU而非其他GPU。

CUDA架構(gòu)推進(jìn)遇阻

這三家設(shè)備商為愛(ài)立信、諾基亞與三星,它們均已對(duì)虛擬化RAN(vRAN)技術(shù)進(jìn)行投資。該技術(shù)以通用CPU替代了5G網(wǎng)絡(luò)中常見(jiàn)的專(zhuān)用集成電路(ASIC)。英偉達(dá)提出的AI-RAN是這一概念的演進(jìn),它建議保留CPU用于處理計(jì)算強(qiáng)度較低的工作負(fù)載,同時(shí)引入GPU作為L(zhǎng)ayer 1的“內(nèi)聯(lián)”加速器——Layer 1在RAN軟件棧中屬于資源密集型部分。

當(dāng)前的問(wèn)題在于,上述三大設(shè)備商均未展現(xiàn)出采用英偉達(dá)統(tǒng)一計(jì)算設(shè)備架構(gòu)(CUDA)來(lái)基于GPU進(jìn)行RAN開(kāi)發(fā)的強(qiáng)烈意愿。愛(ài)立信與三星更傾向于采用“旁路(lookaside)”vRAN架構(gòu),該方案為實(shí)現(xiàn)硬件獨(dú)立性,致力于最大限度將軟件保留在CPU運(yùn)行。在現(xiàn)行部署中,僅Layer 1中的高負(fù)載任務(wù)——前向糾錯(cuò)(FEC)需使用硬件加速器。

愛(ài)立信表示,在試驗(yàn)環(huán)境中,其為英特爾x86架構(gòu)CPU編寫(xiě)的軟件經(jīng)少量修改即可移植至Grace平臺(tái)。這意味著即便最終采用GPU進(jìn)行任何RAN計(jì)算,也僅用于FEC處理。三星同樣在Grace平臺(tái)進(jìn)行軟件測(cè)試,并在最近明確表示不考慮采用Layer 1內(nèi)聯(lián)加速器?!爱?dāng)CPU無(wú)法提供足夠容量時(shí),才需要內(nèi)聯(lián)加速器?!痹摴窘谕ㄟ^(guò)郵件向Light Reading表示,“隨著技術(shù)的進(jìn)步,CPU已具備支持增強(qiáng)容量的能力,我們預(yù)計(jì)即使沒(méi)有內(nèi)聯(lián)加速器也可支持足夠的容量?!?/p>

諾基亞則另辟蹊徑,將vRAN資源集中投入內(nèi)聯(lián)架構(gòu)。但其Layer 1加速器來(lái)自Marvell Technology而非英偉達(dá),且該公司承認(rèn)轉(zhuǎn)向CUDA架構(gòu)需完全重寫(xiě)代碼。諾基亞移動(dòng)網(wǎng)絡(luò)業(yè)務(wù)集團(tuán)負(fù)責(zé)人Tommi Uitto在今年3月MWC巴塞羅那期間表示,除非電信運(yùn)營(yíng)商采用GPU進(jìn)行主流AI推理,否則幾乎沒(méi)有必要進(jìn)行此類(lèi)重構(gòu)開(kāi)發(fā)。

“在這種情況下,大部分計(jì)算將用于Layer 1之外的工作負(fù)載,那么使用Layer 1加速器也就無(wú)關(guān)緊要了?!彼?dāng)時(shí)指出,“最終,我們希望在GPU中也實(shí)現(xiàn)Layer 1。”在此之前,諾基亞對(duì)英偉達(dá)技術(shù)的關(guān)注點(diǎn)更可能聚焦于將Grace用于Layer 1以上的功能模塊。

復(fù)蘇邊緣計(jì)算的設(shè)想

如果說(shuō)將Grace Blackwell芯片作為AI推理的關(guān)鍵組件部署于電信數(shù)據(jù)中心已難以想象,那么ARC-Compact就更難扮演這一角色了。委婉而言,如今關(guān)于電信運(yùn)營(yíng)商可以從超大規(guī)模云服務(wù)商(hyperscaler)與其他數(shù)據(jù)中心企業(yè)服務(wù)不足的眾多地點(diǎn)提供AI 推理服務(wù)并實(shí)現(xiàn)盈利的構(gòu)想近乎不切實(shí)際,這聽(tīng)起來(lái)像是試圖重振邊緣計(jì)算的又一次嘗試。

甚至連電信運(yùn)營(yíng)商自身亦對(duì)此缺乏信心。Omdia近期開(kāi)展了一項(xiàng)調(diào)查,詢問(wèn)受訪者認(rèn)為未來(lái)大多數(shù)AI處理將發(fā)生在何處。僅17%的受訪者回答是基站與樞紐站點(diǎn),另有6%選擇了中心機(jī)房與前端站點(diǎn)。占比高達(dá)43%的最主流答案為終端用戶設(shè)備。電信運(yùn)營(yíng)商似乎處于終端設(shè)備與hyperscaler云服務(wù)之間的無(wú)人區(qū),他們相較于后者的唯一優(yōu)勢(shì)在于更低的網(wǎng)絡(luò)時(shí)延。

遺憾的是,對(duì)于一個(gè)中等規(guī)模的國(guó)家來(lái)說(shuō),那種需要大量站點(diǎn)才能支撐的超低時(shí)延服務(wù)需求幾乎為零。Omdia高級(jí)首席分析師Kerem Arsal在最近于倫敦舉行的一場(chǎng)活動(dòng)上指出,AI-RAN方案的負(fù)面因素目前仍遠(yuǎn)超其優(yōu)勢(shì)?!按送猓琱yperscaler對(duì)邊緣計(jì)算及合作伙伴關(guān)系的興趣有所消退,部分原因在于其商業(yè)模式未必會(huì)給邊緣計(jì)算帶來(lái)那么多回報(bào)?!彼治龇Q(chēng),電信運(yùn)營(yíng)商在邊緣計(jì)算方面迄今尚未展現(xiàn)“具有說(shuō)服力的差異化價(jià)值”。

隨著業(yè)界對(duì)英特爾未來(lái)前景的疑慮升溫,Grace的出現(xiàn)顯得恰逢其時(shí)。此前,英特爾是vRAN CPU領(lǐng)域的唯一選擇。若RAN供應(yīng)商能證明其軟件可近乎零修改地在x86與Arm架構(gòu)之間進(jìn)行遷移,則標(biāo)志著其已實(shí)現(xiàn)底層硬件解耦。同時(shí),CPU性能的持續(xù)提升對(duì)長(zhǎng)期貶低其能力的廠商構(gòu)成挑戰(zhàn)。英偉達(dá)CEO黃仁勛曾于去年9月表示:“CPU無(wú)法跟上ASIC的工作負(fù)載處理能力。”

Kerem Arsal指出:“AI處理架構(gòu)可能從當(dāng)前以GPU為核心的形態(tài)逐步向性能更強(qiáng)的CPU傾斜。此外,總體而言,模型輕量化趨勢(shì)顯著,設(shè)備自主處理關(guān)鍵AI工作復(fù)雜的可能性正在提升?!?這一趨勢(shì)顯然與黃仁勛的預(yù)期背道而馳。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2025-05-21
英偉達(dá)AI-RAN最新動(dòng)作:輕量化解決方案ARC-Compact登場(chǎng)
英偉達(dá)AI-RAN最新動(dòng)作:輕量化解決方案ARC-Compact登場(chǎng),C114訊 北京時(shí)間5月21日消息(岳明)Light Reading在一篇最新報(bào)道中針對(duì)英偉達(dá)ARC

長(zhǎng)按掃碼 閱讀全文