5月24日消息(邵鵬慧)昨日,CIOE中國光博會與C114通信網聯合舉辦的“2024中國光通信高質量發(fā)展論壇”第四場——“AI時代:數據中心光互聯技術新趨勢”線上研討會順利召開。
阿里云光網絡技術專家陳欽應邀作了題為《AI網絡對光互聯的需求和挑戰(zhàn)》的主題演講。陳欽表示,AI應用帶來了海量的光模塊需求,未來GPU間的scale-up網絡將持續(xù)推高光模塊的需求,同時AI也催化了光模塊更新迭代的速度,對光模塊的穩(wěn)定性要求也進一步提高,AI對光模塊也帶來巨大的挑戰(zhàn),。
AI發(fā)展帶來海量光模塊新增需求
當前,隨著AI和算力發(fā)展,作為數據中心內部以及數據中心之間連接的重要技術,光模塊產業(yè)快速崛起迎來高速發(fā)展時期,其速率和帶寬的提升對于滿足AI時代數據傳輸的需求至關重要,AI網絡建設帶來海量的光模塊需求。
如何量化AI對光模塊的需求,陳欽介紹,在通用計算網絡中可以通過接入的服務器數量來獲得光模塊的需求量;同理在AI網絡中,可以通過GPU卡數量來推測光模塊的用量。
當前AI網絡中,GPU卡和800G光模塊數量的比例約為1:3,未來,Scale-up GPU網絡(compute Fabric)將帶來更多的光互聯需求,光模塊的需求和光模塊的成本支出在AI集群中占比將大幅上升。
AI催化光模塊技術演進:光模塊迭代周期縮減一倍
回顧過去10年數據中心光模塊演進歷程,交換芯片的容量遵循每兩年翻一倍的規(guī)律,而這是通過Serdes 數量和Serdes 速率,每兩年交替的翻倍來達到的;
Serdes單通道速率和光模塊單波長速率實際上是每4年翻一倍,主流光模塊每4年更新一代。
AI的應用催化了光互聯的演進速率,光模塊從原本每4年更新一代,縮短為每2年更新一代,新一代光模塊研發(fā)到落地的周期將要求被大幅縮短,這個變化對于整個光模塊生態(tài)而言都是一個極大的挑戰(zhàn)。
AI網絡對光互聯穩(wěn)定性提出兩方面挑戰(zhàn)
陳欽表示AI大模型訓練對光互聯的穩(wěn)定性要求極高,當前AI網絡穩(wěn)定性的挑戰(zhàn)主要來自兩方面。
一方面是光模塊硬件,主要是光器件失效引起的,包括激光器和探測器失效。陳欽介紹,光器件的Wear-out失效不是問題,早期失效和隨機失效才是關鍵。 當前的行業(yè)標準GR468對光模塊和光芯片的測試標準太松,并不適用于AI網絡。鑒于此,阿里云對光器件的可靠性提出了更為嚴格的標準。
另一方面是光模塊軟件,高速光模塊普遍使用CMIS管理協議,帶來了強大的功能,但也使系統(tǒng)設備和模塊的交互變得更復雜。對此陳欽建議,光模塊廠家應加強光模塊在各系統(tǒng)設備上的集成適配測試。
AI網絡下光模塊功耗挑戰(zhàn):TRO技術成為發(fā)展新方向
2018年 PAM4 DSP在光模塊中出現,光的功耗開始超過電的功耗,成為網絡中功耗占比最高的部分,到1.6T/3.2T光模塊,數據中心將需要新的技術處理功耗問題,例如液冷技術。功耗的變化,將會給AI基礎設施帶來極大的技術挑戰(zhàn)。
那么應該如何降低光模塊的功耗,陳欽表示最直接的手段就是去掉或減少DSP在光模塊內部的使用,也就是被討論的技術熱點:LPO、TRO、CPO技術。
CPO光和交換芯片共封裝融為一體,是一種完全封閉的生態(tài),它不符合數據中心開放解耦的要求,也無法做到“pay as your growth”,此外CPO的運維也面臨重重挑戰(zhàn),所以CPO只有在可插拔光模塊演進不下去時才會被考慮。
LPO方案是完全去掉DSP,在功耗、成本和時延上有很大優(yōu)勢。但在標準化和互聯互通方面仍具有很大挑戰(zhàn)。若LPO無法做到互聯互通,便不符合數據中心對開放解耦的要求。此外,LPO技術到單波200G是否可持續(xù)也有較大爭論,綜合來看,LPO技術落地的挑戰(zhàn)性較大。
TRO去掉一半DSP,是一種折中的技術方案,它也能夠有效降低功耗,得益于ASIC Serdes接收端強大的均衡能力,TRO的鏈路性能可以得到保證,另外TRO也更容易制定標準和互聯互通,符合數據中心對開放解耦的要求,“TRO是一個非常有潛力的下一代光互聯技術方案”,陳欽表示。
- 咖香匯客 鐵塔有約 | 上海鐵塔助力2025上海國際咖啡文化節(jié)樂享“無界”
- WinWin高端訪談:菲律賓Smart以5G Max推動體驗進化,重新定義5G價值邊界
- 通用人工智能備受矚目,但工業(yè)人工智能將發(fā)揮巨大作用|觀察
- 到2029年,交通管理市場預計將達到757.4億美元
- 為什么核能可能是滿足人工智能日益增長的電力需求的關鍵
- 到2030年,全球智能家居市場預計將達到5372.7億美元
- 為何“脫碳”成了全球關注的焦點?
- AI和AaaS如何助力企業(yè)IT轉型
- 聚焦“智聯、智艙、智城”,中國移動發(fā)布“AI CAR”服務體系
- 中國電信柯瑞文:適度超前開展智算建設,進一步強化云智一體能力
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。