5月7日,記者獲悉,騰訊技術(shù)團(tuán)隊(duì)針對(duì)DeepSeek開(kāi)源的DeepEP通信框架進(jìn)行深度優(yōu)化,使其在多種網(wǎng)絡(luò)環(huán)境下均實(shí)現(xiàn)顯著性能提升。經(jīng)測(cè)試,優(yōu)化后的通信框架性能在RoCE網(wǎng)絡(luò)環(huán)境提升100%,IB網(wǎng)絡(luò)環(huán)境提升30%,為企業(yè)開(kāi)展AI大模型訓(xùn)練提供更高效的解決方案。相關(guān)技術(shù)方案獲得了DeepSeek公開(kāi)致謝,稱這是一次“huge speedup”代碼貢獻(xiàn)。
自今年2月DeepSeek開(kāi)源包括DeepEP在內(nèi)的五大代碼庫(kù)以來(lái),該團(tuán)隊(duì)便向業(yè)界展示了如何利用有限的硬件資源實(shí)現(xiàn)接近萬(wàn)卡集群的性能。在這些技術(shù)中,DeepEP憑借突破性的方法提升了300%的通信效率,成功解決了MoE架構(gòu)大模型對(duì)英偉達(dá)NCCL的依賴問(wèn)題。
但該技術(shù)在成本較低、適用面更廣的RoCE網(wǎng)絡(luò)環(huán)境中表現(xiàn)不佳,限制了其在更廣泛場(chǎng)景的應(yīng)用。這一痛點(diǎn)引發(fā)了開(kāi)源社區(qū)的持續(xù)討論。
騰訊星脈網(wǎng)絡(luò)團(tuán)隊(duì)基于在RoCE網(wǎng)絡(luò)領(lǐng)域的深厚積累,在DeepEP開(kāi)源后便展開(kāi)技術(shù)攻關(guān),發(fā)現(xiàn)兩大關(guān)鍵瓶頸:一是對(duì)于雙端口網(wǎng)卡帶寬利用率不足,二是CPU控制面交互存在時(shí)延。
騰訊在RoCE網(wǎng)絡(luò)優(yōu)化方面的突破,首先體現(xiàn)在帶寬分配的智能化,通過(guò)拓?fù)涓兄亩郠P建鏈技術(shù),智能分配數(shù)據(jù)流,優(yōu)化了雙端口網(wǎng)卡的帶寬利用率,確保每條數(shù)據(jù)通道都能得到充分使用。此舉有效避免了帶寬浪費(fèi),為RoCE網(wǎng)絡(luò)的性能提升提供了有力支撐。
其次,騰訊還著力解決了GPU通信中的CPU控制瓶頸問(wèn)題。通過(guò)基于IBGDA技術(shù)的優(yōu)化,騰訊使得“控制面”場(chǎng)景的操作也可以繞過(guò)CPU的“中轉(zhuǎn)”,進(jìn)一步降低了延遲和能耗,提升了整體通信效率。
同時(shí),GPU直接“對(duì)話”時(shí)存在的傳輸順序混亂難題,騰訊提出了“QP內(nèi)時(shí)序鎖”機(jī)制,使得多個(gè)GPU間的數(shù)據(jù)傳輸能夠精準(zhǔn)、按順序完成,即使同時(shí)處理1000多個(gè)數(shù)據(jù)傳輸任務(wù),DeepEP也能自動(dòng)理順先后順序。
在騰訊的技術(shù)優(yōu)化下,DeepEP不僅在RoCE網(wǎng)絡(luò)實(shí)現(xiàn)性能翻倍,反哺到IB(InfiniBand)網(wǎng)絡(luò)時(shí)更使原有通信效率再提升30%。
(騰訊工程師在不同節(jié)點(diǎn)服務(wù)器上的測(cè)試數(shù)據(jù))
目前該技術(shù)已全面開(kāi)源,并成功應(yīng)用于騰訊混元大模型等項(xiàng)目的訓(xùn)練推理,在騰訊星脈與H20服務(wù)器構(gòu)建的高性能環(huán)境中,這套方案同樣展現(xiàn)出卓越的通用性。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 城市中年失業(yè)有多慘:除了送外賣(mài),就是跑網(wǎng)約車(chē)
- 十年傅利葉,具身成翼
- 為什么想要做成一個(gè)電商平臺(tái)會(huì)這么難?
- 異構(gòu)智算 本地引擎|聯(lián)想推出六大創(chuàng)新黑科技,引領(lǐng)中國(guó)算力變革新時(shí)代
- 真相曝光,不僅殲10建功,連落后的梟龍也暴揍陣風(fēng),震撼全球
- 算了算上周“賬單”,很多人開(kāi)始期待“靈活休假”
- AI大模型的商業(yè)“回旋鏢”,重新落到了云計(jì)算丨貿(mào)易戰(zhàn)下的產(chǎn)業(yè)韌性(二)
- 被關(guān)稅“重壓”出來(lái)的本土充沛算力資源丨貿(mào)易戰(zhàn)下的產(chǎn)業(yè)韌性(一)
- 華為又有劃時(shí)代產(chǎn)品問(wèn)世,鴻蒙電腦打破西方長(zhǎng)期壟斷
- SID2025啟幕在即,TCL華星將攜APEX臻圖和印刷OLED全家桶重磅亮相
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。