中國移動今年將商用三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡

4月28日消息 今天上午,以“算力網(wǎng)絡(luò)點亮AI新時代”為主題的中國移動算力網(wǎng)絡(luò)大會在蘇州開幕。

中國移動副總經(jīng)理高同慶在會上作了題為《打造大國算網(wǎng)重器,開啟AI+時代新篇》的主旨演講!

高同慶指出,中國移動將持續(xù)優(yōu)化算力網(wǎng)絡(luò)資源總體布局,面向AI+升級,今年將商用哈爾濱、呼和浩特、貴陽三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡,充分滿足大模型集中訓練需求;隨著大模型訓練逐漸轉(zhuǎn)向大規(guī)模行業(yè)應(yīng)用,泛在的推理需求持續(xù)涌現(xiàn),中國移動將按需在1500個邊緣節(jié)點部署推理算力,形成“中心大集群、邊緣廣分布、中訓邊推、訓推一體”的智算網(wǎng)絡(luò)。

同時,中國移動將持續(xù)完善技術(shù)體系,推進全棧技術(shù)創(chuàng)新。

一是突破堵點,加快邁向超萬卡集群。面向機間互聯(lián),原創(chuàng)提出全調(diào)度以太技術(shù)體系(GSE),構(gòu)建無阻塞、高帶寬、超低時延的新型智算中心網(wǎng)絡(luò),對標國際主流的IB和UEC方案,形成中國自主的技術(shù)體系,今年將開展GSE中試,加速GSE關(guān)鍵技術(shù)和產(chǎn)業(yè)成熟;面向卡間互聯(lián),打造標準開放總線級互聯(lián)架構(gòu),提升GPU卡間高帶寬、低時延通信能力,實現(xiàn)互聯(lián)拓撲和協(xié)議的全棧級優(yōu)化,為標準開放的新型智算互聯(lián)貢獻中國方案。

二是多元異構(gòu),構(gòu)建融合開放的大算力生態(tài)。持續(xù)推進一云多芯的多樣算力,打破AI芯片生態(tài)豎井,今年將升級“芯合”算力原生平臺,支持智算應(yīng)用在更多GPU芯片的快速遷移,同時還支持面向大模型的分布式異構(gòu)混訓,打破當前大模型僅能在單廠家單型號集群訓練的局限。中國移動將進一步實現(xiàn)云底座關(guān)鍵技術(shù)突破,升級“大云天元”操作系統(tǒng),商用推廣云原生數(shù)據(jù)庫、新一代SDN網(wǎng)絡(luò),也會推出新一代磐石DPU,打造一機多芯的磐石服務(wù)器,全面使能多樣化智能算力。

三是訓推一體,打造開箱即用AI服務(wù)。自研智算平臺,打造模型訓練“自動化生產(chǎn)線”,實現(xiàn)AI模型全生命周期服務(wù),支持全棧、全自主可控、全地域的資源統(tǒng)一管理調(diào)度,提供一站式開發(fā)工具箱,支持萬卡并行訓練、千卡15天以上穩(wěn)定訓練、分鐘級斷點續(xù)訓,確保大模型訓得好、快、穩(wěn)。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-04-28
中國移動今年將商用三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡
中國移動今年將商用三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡,C114訊4月28日消息 今天上午,以“算力網(wǎng)絡(luò)點亮AI新時代”為主題的中國移動算力網(wǎng)絡(luò)大會在蘇州開

長按掃碼 閱讀全文