一、行業(yè)背景:AI算力需求變革催生新架構機遇
隨著AI技術從“暴力堆算力”的ChatGPT時代邁入“效率優(yōu)先”的DeepSeek新階段,行業(yè)競爭焦點逐漸轉向算力成本優(yōu)化與資源利用率提升。以DeepSeek等為代表的高效模型通過算法創(chuàng)新(稀疏化、量化)顯著降低算力需求,但多模態(tài)、實時推理等場景對數(shù)據(jù)吞吐效率和內存靈活性的要求不降反升。傳統(tǒng)計算架構面臨三大瓶頸:
內存墻:GPU/加速器與CPU間數(shù)據(jù)搬運延遲高,HBM成本居高不下;
資源孤島:計算、存儲、網絡設備分立,利用率不足;
擴展性限制:單機內存容量受限,分布式訓練通信開銷大。
在此背景下,CXL(Compute Express Link)作為一種顛覆性互聯(lián)協(xié)議,憑借其內存池化、緩存一致性和低延遲特性,成為突破上述瓶頸的關鍵技術,其商業(yè)化進程已進入爆發(fā)前夜。
二、CXL技術優(yōu)勢:重構算力基礎設施的“神經中樞”
CXL技術是一種高速互聯(lián)技術,旨在改善計算系統(tǒng)內部各個組件之間的通信效率。它提供了一種高帶寬、低延遲的通信通道,使內存、加速器和其他計算資源能夠直接連接,從而大幅提升了數(shù)據(jù)傳輸速度和系統(tǒng)整體性能。
CXL技術的出現(xiàn)為計算密集型任務和數(shù)據(jù)密集型應用帶來了巨大的潛力,并為下一代數(shù)據(jù)中心架構的構建提供了新的思路。CXL技術的設計目標是提供一種通用的高速互連接口,可以與不同類型的計算加速器和設備進行連接。它基于PCI Express(PCIe)物理層和協(xié)議,但在協(xié)議層面進行了擴展和優(yōu)化,以滿足高性能計算和數(shù)據(jù)中心應用的需求。
1.內存資源革命:從“獨占”到“共享”
(1)內存池化(Memory Pooling):CXL支持跨CPU、GPU、FPGA等設備的內存統(tǒng)一編址,可將分散的內存聚合為共享池,動態(tài)分配給不同任務。例如,訓練任務可“借用”空閑推理服務器的內存,降低硬件的冗余投資。
(2)彈性擴展:通過CXL連接的內存擴展卡,單服務器內存容量可從TB級提升至PB級,突破大模型訓練的內存限制,同時減少采購高價HBM。這不僅可以提高系統(tǒng)的可擴展性,還能降低總體擁有成本(TCO)。
2.打破“數(shù)據(jù)搬運墻”
(1)緩存一致性協(xié)議:CXL允許CPU與加速器直接共享緩存,減少數(shù)據(jù)復制次數(shù),顯著降低AI推理延遲。這對于需要快速響應的應用場景尤為重要,如自動駕駛和實時數(shù)據(jù)分析。
(2)帶寬及組網優(yōu)勢:CXL 3.0版本提供高達64GT/s的傳輸速率,是PCIe 5.0的2倍,且支持多層級聯(lián),非常適合AI集群的橫向擴展。這種高效的組網能力使得大規(guī)模并行計算成為可能,提升了整體計算效率。
3.顯著降本增效
利用CXL內存擴展顯然會對資本支出產生巨大影響。業(yè)內普遍認為,對于超大規(guī)模數(shù)據(jù)中心而言,內存成本占總資本支出的約50%。
市場調研機構ABI Research在一份報告中介紹,CXL技術通過內存池化和共享內存資源,顯著提高了內存利用率。例如,與傳統(tǒng)方案相比,CXL內存擴展可以將每GB內存的成本降低約52%。采用CXL技術后,采用內存擴展的CPU的每GB內存成本將大幅降低。平均而言,將節(jié)省55%。
內存成本節(jié)省是CXL技術的主要需求驅動因素之一,總體性能的提升也是各大廠商積極部署CXL的重要因素。在數(shù)據(jù)中心領域,CXL技術通過統(tǒng)一內存地址空間和減少通信延遲,顯著提升了系統(tǒng)性能。例如,SK海力士與數(shù)據(jù)處理平臺企業(yè)HazelCast的實證結果顯示,采用CXL內存后,系統(tǒng)處理速率提升了40%,超越僅使用DRAM的系統(tǒng);同時,延遲時間減少了30-50%。這表明,使用CXL內存可以有效節(jié)省高昂的DRAM成本。
三、應用場景:從云到端,CXL落地加速
1.云計算與數(shù)據(jù)中心
(1)AI訓練集群:通過CXL內存共享,可減少千億參數(shù)模型的訓練節(jié)點數(shù)量,以及通信開銷。這對于大規(guī)模深度學習模型的訓練具有重要意義,能夠大幅縮短訓練時間并降低運營成本。
(2)混合負載整合:同一服務器同時運行AI推理、數(shù)據(jù)庫與虛擬化任務,可以提升資源利用率。這種靈活的任務調度方式提高了服務器的整體效能,使其能夠在不同的工作負載之間實現(xiàn)無縫切換。
2.邊緣計算與終端設備
(1)智能汽車:CXL實現(xiàn)CPU、NPU等處理器的內存統(tǒng)一管理,滿足自動駕駛低延遲需求。在復雜的交通環(huán)境中,毫秒級的響應速度至關重要,CXL技術可以幫助車輛更快地做出決策。
(2)AR/VR設備:通過CXL互聯(lián)的定制化SoC,在有限功耗下支持4K實時渲染與AI交互。這對于沉浸式體驗的增強現(xiàn)實和虛擬現(xiàn)實應用來說,意味著更流暢的用戶體驗和更高的視覺質量。
3.存算一體新范式
CXL與存算一體芯片(如存內計算DRAM)結合,可構建“內存即算力”架構,解決傳統(tǒng)馮·諾依曼瓶頸,潛力市場達百億美元。
四、市場空間與產業(yè)鏈投資圖譜
1.市場規(guī)模預測
據(jù)市場咨詢機構Yole預測,到2028年,CXL市場新增規(guī)模將達到近160億美元。中國市場規(guī)模預計將占1/2,達80億美元。
值得一提的是,除了存儲擴展,CXL 3.0版本引入的CXL Switch將支持多層級聯(lián),使其在功能和適用場景上超越了傳統(tǒng)PCIe Switch,完美適配AI集群的擴展。
(1) CXL Switch 新增市場
Yole預測,到2028年,CXL Switch新增市場規(guī)模將達到7.41億美元。中國市場規(guī)模預計將占1/2,達3.705億美元。
(2) CXL Switch 存量替換市場
結合SNS Insider、Transparency等市場機構數(shù)據(jù),全球 PCIe 交換芯片市場規(guī)模預計將從 2022 年的45.8億美元增長到2028年的104.3億美元。中國市場約占PCIe 交換芯片市場規(guī)模的1/2,預計2028年市場規(guī)模將達52.15億美元。
保守估計,未來有50%以上的PCIe Switch都會逐步切換到CXL Switch上,到2028年全球CXL Switch存量替代市場規(guī)模將達52.15億美元,其中中國該市場規(guī)模將達26.08億美元。
結合存量市場及新增市場,預計到2028年,CXL Switch市場全球將達到59.56億美元,其中中國將占29.79億美元市場。
2.CXL相關上市公司(二級市場):
(1)核心芯片及模組廠商:Intel、AMD、Broadcom、Marvell、Astera Labs、瀾起科技(CXL內存接口芯片)、江波龍、佰維存儲
(2) IP廠商:Synopsis、Rambus
(3) 存儲巨頭:Samsung、Micron、SK Hynix
(4) 服務器廠商:浪潮、新華三、聯(lián)想
(5) 云計算巨頭:亞馬遜AWS、微軟Azure、阿里等云計算廠商大力投入,希望通過技術創(chuàng)新來保持其在云計算市場的領先地位。
五、結論:CXL——開啟算力普惠時代的鑰匙
在AI從“技術炫技”轉向“商業(yè)落地”的臨界點,CXL通過硬件資源解耦與異構效率革命,直擊行業(yè)痛點,未來3-5年將滲透至算力基礎設施全場景。建議投資者把握CXL 3.X標準落地與AI服務器升級周期,建議優(yōu)先布局核心芯片、存儲擴展與生態(tài)龍頭,關注初創(chuàng)企業(yè),分享千億級市場紅利。
通過對CXL技術的深入理解與前瞻布局,投資者不僅可以抓住當前的技術變革機遇,還能為未來的持續(xù)增長奠定堅實基礎。CXL作為新一代計算架構的核心組件,有望引領新一輪的技術革命,助力各行各業(yè)實現(xiàn)智能化轉型。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )