6月26日,一場干貨爆棚的AI算力盛會,在北京燦爛盛夏中熱烈召開。
以大模型、生成式AI為代表的新一輪人工智能浪潮的滾滾向前,催生出前所未有的AI算力需求,算力是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn)力,更是人工智能發(fā)展的基石。
2025年,以DeepSeek為代表的國產(chǎn)大模型強勢突圍,在全球引爆部署熱潮和AI應(yīng)用開發(fā)熱潮,也給國內(nèi)AI算力市場注入新的活力,推動AI推理算力需求暴漲,超大規(guī)模集群鱗次櫛比,而需求的爆發(fā)也帶來諸多挑戰(zhàn),醞釀新的行業(yè)變化。
為此,我們發(fā)起了一場聚焦前沿技術(shù)與產(chǎn)業(yè)趨勢的夏日AI聚會——2025中國AI算力大會。
從國產(chǎn)AI算力的突圍與崛起,到智算中心深層軟硬件技術(shù)創(chuàng)新解決算力落地產(chǎn)業(yè)難題,近30位重量級嘉賓與會帶來致辭、報告、演講和對話,全方位解構(gòu)DeepSeek引爆的AI算力變局,全場金句頻頻,各路大佬觀點持續(xù)碰撞擦出火花,現(xiàn)場參會人數(shù)超過850人。
在會場外的展區(qū),Alluxio、研惠通、惠普、白山云科技、中昊芯英、中科加禾、科華數(shù)據(jù)、行云集成電路等8家企業(yè)亮出了他們的最新技術(shù)和產(chǎn)品,展區(qū)人頭攢動,交流熱情氛圍濃厚。
▲展區(qū)
由智一科技旗下智猩猩與智東西共同發(fā)起主辦、芯東西協(xié)辦的首屆AI算力大會,圍繞AI算力產(chǎn)業(yè)變局與創(chuàng)新、AI推理算力、智算中心、智算集群異構(gòu)混訓(xùn)、超節(jié)點等話題設(shè)置議程,主會場包括高峰論壇、AI推理算力專題論壇和智算中心專題論壇;分會場為閉門制,組織了智算集群異構(gòu)混訓(xùn)技術(shù)研討會、超節(jié)點技術(shù)研討會。
▲聯(lián)想集團Game of AI科普視頻在大會展播:聯(lián)想海神全液冷解決方案,革命性提升AI推理時代算力
智一科技聯(lián)合創(chuàng)始人、CEO龔倫常在大會致辭環(huán)節(jié)宣布:中國AI算力大會正式成為“智領(lǐng)未來”北京人工智能系列品牌活動之一?!爸穷I(lǐng)未來”是北京市科委、中關(guān)村管委會打造的北京市人工智能領(lǐng)域的活動品牌。同樣作為“智領(lǐng)未來”北京人工智能系列品牌活動之一的中國生成式AI大會已于今年4月1日-2日圓滿舉行。龔倫常還預(yù)告了將于下半年舉行的兩場大型品牌活動:9月在上海舉辦第七屆全球AI芯片峰會,11月在深圳舉辦2025中國具身智能機器人大會。
▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常
智算集群異構(gòu)混訓(xùn)、超節(jié)點兩場技術(shù)研討會在分會場圓滿舉辦。壁仞科技AI軟件首席架構(gòu)師丁云帆、中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所技術(shù)經(jīng)理班有容、北京智源人工智能研究院AI框架研發(fā)負責人敖玉龍、上海人工智能實驗室編譯計算與國產(chǎn)化團隊負責人裴芝林、商湯大裝置技術(shù)產(chǎn)品總監(jiān)劉葉楓在智算集群異構(gòu)混訓(xùn)技術(shù)研討會做了報告分享。
阿里云基礎(chǔ)設(shè)施異構(gòu)硬件和系統(tǒng)及解決方案資深總監(jiān)盧曉偉、中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所技術(shù)經(jīng)理王鵬、奇異摩爾首席網(wǎng)絡(luò)架構(gòu)專家葉棟、曦智科技聯(lián)合創(chuàng)始人兼首席技術(shù)官孟懷宇圍繞超節(jié)點進行了不同視角的報告分享。中信建投證券科技行業(yè)首席分析師閻貴成主持了超節(jié)點技術(shù)研討會及圓桌Panel。
▲分會場
接下來我們將為大家?guī)碇鲿鋈笳搲?5+位分享嘉賓的演講和對話精華。
01.高峰論壇:從千芯節(jié)點到千億大模型國產(chǎn)AI芯片生態(tài)迸發(fā)旺盛活力
AI已成為數(shù)據(jù)中心增長的核心驅(qū)動力。大模型迭代拉動算力需求暴增,推動計算、存儲、網(wǎng)絡(luò)基礎(chǔ)設(shè)施全面升級。在大模型訓(xùn)練與部署需求旺盛的背景下,如何更充分地利用閑置算力,國產(chǎn)AI芯片發(fā)展到了怎樣的新階段,有哪些優(yōu)化大模型推理效果的創(chuàng)新技術(shù)?6位嘉賓分享了他們對產(chǎn)業(yè)最新風(fēng)向的觀察與探索。
1、信通院陳屹力:“算力荒”與“算力閑置”共存,算力互聯(lián)互通、AI云成焦點
中國信息通信研究院云大所副總工程師陳屹力談道,當下AI大規(guī)模應(yīng)用促使智能算力需求激增,AI 云成為全球AI浪潮角逐的焦點。其中AI云基礎(chǔ)設(shè)施需覆蓋異構(gòu)高效調(diào)度能力、一云多模能力、專家知識大腦等多方面。AI云平臺推動AI應(yīng)用的智能、便捷構(gòu)建,提升國際影響力、助力生態(tài)繁榮。
隨任務(wù)型智算應(yīng)用興起,對算力資源的定位、調(diào)度、部署效率提出更高要求。中國信通院聯(lián)合產(chǎn)業(yè)各方探索構(gòu)建算力互聯(lián)網(wǎng),積極推進算力標識、算力調(diào)度、傳輸協(xié)議、應(yīng)用適配等方面技術(shù)研究,加快現(xiàn)有算力“局域網(wǎng)”間互聯(lián)互通,逐步建立標準體系,形成算力互聯(lián)網(wǎng)體系架構(gòu),核心解決算力“找調(diào)用”挑戰(zhàn),逐步形成具備智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng)。
▲中國信息通信研究院云大所副總工程師陳屹力
2、摩爾線程王華:算力需求千倍增長,大集群和FP8成為強需求
摩爾線程副總裁王華引用了一些研究數(shù)據(jù):2020至2025年間,大模型訓(xùn)練的算力需求提升近1000倍 ,驅(qū)動力來自參數(shù)規(guī)模與數(shù)據(jù)量雙向增長。以DeepSeek-V3為例,其訓(xùn)練所需算力達102?級別,在萬卡集群上可將訓(xùn)練時間壓縮至13天內(nèi)完成 。
為應(yīng)對算力需求,摩爾線程提供包括FP8在內(nèi)的全精度算力,有效支持混合精度訓(xùn)練,大幅提升訓(xùn)練效率;部署萬卡集群,研發(fā)完整的軟硬件棧,提供開箱即用的產(chǎn)品,快速滿足大模型訓(xùn)練的算力需求;打造豐富的集群監(jiān)控和診斷能力,針對大規(guī)模集群實現(xiàn)分鐘級故障定位。
此外,摩爾線程構(gòu)建了支持FP8、BF16、FP32等數(shù)據(jù)類型的混合精度訓(xùn)練方案,開源Torch-MUSA、MT-MegatronLM與MT-TransformerEngine等大模型訓(xùn)練組件,已完成DeepSeek-V3的混合精度訓(xùn)練復(fù)現(xiàn)。在多個模型上的實驗結(jié)果表明,其方案整體性能提升可達20%–30%,訓(xùn)練精度與業(yè)界主流保持一致。
▲摩爾線程副總裁王華
3、中昊芯英楊龔軼凡:解讀TPU架構(gòu)創(chuàng)新設(shè)計,國產(chǎn)AI芯片如何抓住本土機遇
中昊芯英創(chuàng)始人、CEO楊龔軼凡談道,AI專用芯片是AI Infra的必然發(fā)展趨勢,TPU架構(gòu)為AI大模型而生,采用多維度計算單元來優(yōu)化數(shù)據(jù)復(fù)用,提高計算效率,并通過更激進的數(shù)據(jù)傳輸策略和更小的控制單元,給片上存儲器和運算單元留下更大空間,其可擴展性也更適合超大規(guī)模計算。
中昊芯英全自研高性能TPU架構(gòu)AI芯片“剎那”于2023年已成功流片并實現(xiàn)量產(chǎn),其計算性能較海外某知名GPU芯片提升近1.5倍?;凇皠x那”的高性能AI服務(wù)器及大規(guī)模AI計算集群“泰則”,支持1024卡高速互聯(lián),可支撐超千億參數(shù)大模型計算。
隨著大模型成本下移,AI芯片架構(gòu)開始深度適配動態(tài)稀疏計算范式,形成“算法定義硬件”的新研發(fā)模式。降低對CUDA生態(tài)的依賴后,國產(chǎn)Al芯片將通過提供定制化工具鏈、優(yōu)化編譯器等方式,在架構(gòu)設(shè)計上更加靈活適應(yīng)新的本土趨勢和需求。
▲中昊芯英創(chuàng)始人、CEO楊龔軼凡
4、魔形智能徐凌杰:大模型需要“千芯”超節(jié)點,未來架構(gòu)有五大關(guān)鍵因素
魔形智能科技創(chuàng)始人、CEO徐凌杰幽默開場:“過去十年,中國最值錢的是房地產(chǎn)行業(yè)。未來最值錢的,可能還是房地產(chǎn),只不過住的不是人,而是機器。”
研究數(shù)據(jù)顯示,全球數(shù)據(jù)中心總耗電量與單個發(fā)達國家相當。更強的大模型需要大集群,更快的大模型需要超節(jié)點,更大的高帶寬互聯(lián)域是超節(jié)點設(shè)計的核心。當前算力密度遠不夠高,要達到與人腦相當?shù)乃懔γ芏龋枰獦?gòu)建“千芯”超節(jié)點,構(gòu)建可重構(gòu)的AI算力中心。
如何構(gòu)建千芯互連網(wǎng)絡(luò)?徐凌杰總結(jié)了未來超節(jié)點架構(gòu)的5大關(guān)鍵因素:超高密度算力節(jié)點,千芯多機柜級聯(lián)背板連接,800V供電輸入,交換芯片全互聯(lián),全覆蓋式冷卻。
他還分享了下一代算力基礎(chǔ)設(shè)施對芯片提出的3大要求:板級&封裝級靈活組合與解耦,整合光電共封裝設(shè)計,Cluster First的產(chǎn)品理念。軟硬協(xié)同將釋放超大集群的潛力。
▲魔形智能科技創(chuàng)始人、CEO徐凌杰
5、中科加禾崔慧敏:AI編譯優(yōu)化躍升推理性能,有效擴展國產(chǎn)AI芯片生態(tài)
中國科學(xué)院計算技術(shù)研究所研究員、中科加禾創(chuàng)始人崔慧敏談道,大模型推理私有化部署需求大漲,但面臨硬件繁多、需求多元、多模部署等多重挑戰(zhàn)。
中科加禾圍繞編譯優(yōu)化構(gòu)建大模型推理的引擎和軟件棧,積累了大量實踐案例:在推理引擎中實施深度顯存優(yōu)化,有效提高顯存利用率;在大規(guī)模推理中實現(xiàn)多維并行策略,有效利用計算、訪存、通信資源;基于多項聯(lián)合優(yōu)化,推理技術(shù)在某互聯(lián)網(wǎng)廠商合作中將QPS提升50%以上,并在昇騰910B平臺私有化部署場景下有效支持128K長上下文。
長期來看,基于AI編譯技術(shù),構(gòu)建一套底層公共的編譯支撐,能夠長期有效解決AI生態(tài)碎片化及生態(tài)融合問題。
▲中國科學(xué)院計算技術(shù)研究所研究員、中科加禾創(chuàng)始人崔慧敏
6、趨境科技陳祥麟:千億大模型的異構(gòu)推理新路徑
趨境科技技術(shù)負責人陳祥麟分享了大模型推理的技術(shù)創(chuàng)新。他認為大模型私有化推理架構(gòu)將從傳統(tǒng)的以GPU為中心轉(zhuǎn)向全系統(tǒng)異構(gòu)協(xié)同,需要充分提升算力利用率。
團隊首創(chuàng)全系統(tǒng)異構(gòu)協(xié)同與以存換算技術(shù),充分利用底層GPU、CPU、存儲等硬件設(shè)備算力,通過基于計算強度的offload策略、CPU/GPU的高性能算子改造、MTP等算力優(yōu)化方法,以及prefix cache等融合推理策略,提升全系統(tǒng)算力,將大模型推理門檻降低至1/10。
趨境科技與清華KVCache.AI團隊共同開源的異構(gòu)推理框架KTranformers,能夠利用單張消費級GPU+CPU異構(gòu)推理DeepSeek-671B-r1/v3,decode速度最高達到20+ tokens/s。
同時參與月之暗面、清華MADSys實驗室等多個產(chǎn)學(xué)研機構(gòu)開源的項目Mooncake,以超大規(guī)模KVCache緩存池為中心,通過以存換算的創(chuàng)新理念大幅度減少算力開銷,顯著提升了推理吞吐量。
▲趨境科技研發(fā)負責人陳祥麟
02.高端對話:國產(chǎn)AI算力的突圍與崛起中美差距正逐步縮小
以《國產(chǎn)AI算力的突圍與崛起》為主題的高端對話,由智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁主持,中昊芯英創(chuàng)始人兼CEO楊龔軼凡,魔形智能科技創(chuàng)始人、CEO徐凌杰,中科加禾聯(lián)合創(chuàng)始人兼CTO陳龍三位嘉賓進行分享。
張國仁談道,從2018年AI芯片峰會到如今AI算力峰會,他感觸最深的是國內(nèi)企業(yè)對自己的產(chǎn)品、公司發(fā)展都表現(xiàn)得愈發(fā)云淡風(fēng)輕。
▲智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁
1、國產(chǎn)算力與全球差距仍然存在
面對國產(chǎn)算力在全球發(fā)展中的地位,陳龍談道,國內(nèi)廠商已掌握算力底層技術(shù),但在PyTorch等主流訓(xùn)練框架適配方面仍處于跟隨、陪跑階段。
楊龔軼凡從硬件的設(shè)計和生產(chǎn)兩方面進行了比較:生產(chǎn)差距存在,但預(yù)測將在3-5年內(nèi)逐步縮??;而在設(shè)計層面,從學(xué)術(shù)研究、論文創(chuàng)新性等角度看,設(shè)計的差距更大。隨著模型算法收斂,更多創(chuàng)新型架構(gòu)、設(shè)計出現(xiàn),國外諸多路線已發(fā)展到產(chǎn)品落地,國內(nèi)廠商需要共同拓展生態(tài)。
▲中昊芯英創(chuàng)始人兼CEO楊龔軼凡
徐凌杰認為,在如何做優(yōu)秀的GPU、如何搭建生態(tài)、如何做集群等方面,中美認知差距正不斷縮小。但實際產(chǎn)業(yè)中,差距進一步擴大,企業(yè)需要從底層供應(yīng)鏈突破。
2、算力仍是資源導(dǎo)向型市場
對于國產(chǎn)算力的市場化,徐凌杰判斷,政府、資源導(dǎo)向型的現(xiàn)狀未來幾年不會有很大改變,芯片晶圓、制程以及芯片創(chuàng)企在國產(chǎn)生態(tài)中的成長,都需要政府扶持。芯片公司的機會是通過更強互聯(lián)、集群打造差異化,找到商業(yè)化落腳點。
楊龔軼凡同樣認為,資源導(dǎo)向型走向市場導(dǎo)向型是一個過程,在半導(dǎo)體行業(yè),老的生產(chǎn)制程永遠比新的生產(chǎn)制程性價比低,生產(chǎn)制程每迭代一次會有4倍的性價比提升,這就導(dǎo)致純國產(chǎn)芯片的性價比更低,需要政府扶持拉通生產(chǎn)工藝的產(chǎn)業(yè)鏈。
陳龍從應(yīng)用層面進行分析,談到國家的扶持很必要,企業(yè)通過軟硬件優(yōu)化降低了部署成本,但消費側(cè)拉動還不夠強,現(xiàn)狀是上一代芯片尚沒有完全落地應(yīng)用,下一代芯片已經(jīng)出來了,因此核心是要發(fā)掘更有價值的應(yīng)用。
▲中科加禾聯(lián)合創(chuàng)始人兼CTO陳龍
3、專用芯片、編譯技術(shù)、超節(jié)點,是未來發(fā)展方向
楊龔軼凡堅信專用芯片是未來的發(fā)展方向,在通用性需求大幅降低的情況下,可以拋棄部分通用性,增加芯片核心的性能和性價比。越專越好,是在滿足一定可控性和變化下的結(jié)果。
圍繞編譯技術(shù)在解決國產(chǎn)芯片面臨的風(fēng)險,陳龍認為,它是將專家的經(jīng)驗泛化、普適化的一種技術(shù)手段。編譯技術(shù)最開始產(chǎn)生是為了彌補人的思維和機器能接受信息之間的鴻溝,使開發(fā)效率提升上百倍。
徐凌杰著重談到超節(jié)點的發(fā)展方向,在大模型領(lǐng)域,類似MoE的創(chuàng)新結(jié)合超節(jié)點會有更大收益,即更大的問題用更大的集群解決,更大的集群反哺系統(tǒng),從而做出更大的模型。
▲魔形智能科技創(chuàng)始人、CEO徐凌杰
4、算力產(chǎn)業(yè)格局未定
談到全球算力產(chǎn)業(yè)的產(chǎn)業(yè)格局,陳龍認為,雖然國內(nèi)巨頭有積累優(yōu)勢,但產(chǎn)業(yè)規(guī)模足夠大,且需求多元化,將來企業(yè)將百花齊放。
楊龔軼凡的觀點更為激進:首先,3-5年內(nèi)形成產(chǎn)業(yè)格局的可能性不高,目前仍是企業(yè)相互競爭、高速發(fā)展變革的過程;其次,資源型市場的天然屬性決定了其很難形成壟斷,且巨頭穿越周期能力弱,因此AI產(chǎn)業(yè)爆發(fā)后市場格局會洗牌,初創(chuàng)公司或許會通過更好的組織形式去適應(yīng)產(chǎn)業(yè)發(fā)展。
行業(yè)的重要性、資本周期發(fā)展對產(chǎn)業(yè)發(fā)展都會有影響。徐凌杰相信,算力變得越來越有吸引力,自然會有更多的錢涌入,會出現(xiàn)巨頭被沖擊、新生勢力冒出的場景。創(chuàng)企和巨頭需要找準自己的定位,通過“整合”變成更強實體可能是一條發(fā)展路徑。
如今中國算力規(guī)模已在全球排名第二,被預(yù)測有望影響全球AI 競賽格局。陳龍認為,AI算力市場規(guī)模和國家GDP發(fā)展成正比關(guān)系,當國家GDP反超或許是國產(chǎn)算力格局更進一步的機會。楊龔軼凡提到投入產(chǎn)出比,目前美國和中國算力開銷差10倍,當投入量逐步趕上才會有變化。徐凌杰認為未來當AI賦能千行百業(yè),算力真正變成生產(chǎn)力時,就是一個巨大的機會。
03.專題論壇:從軟硬協(xié)同到端邊云協(xié)同底層技術(shù)創(chuàng)新突破AI算力瓶頸
下午場火熱繼續(xù),在AI推理算力專題論壇和智算中心專題論壇中,來自行云集成電路、安謀科技、實在智能、白山云科技、Alluxio、浩云長盛集團、上海矩向科技、趨動科技的8位嘉賓帶來了精彩演講。
如何突破大模型推理芯片的核心瓶頸、如何實現(xiàn)出色的端側(cè)模型性能?超大規(guī)模智算中心面臨的數(shù)據(jù)、成本功耗、算力利用率等方面的一系列難題要如何破解?我們都將找到答案。
1、行云余洪敏:只有軟硬件協(xié)同創(chuàng)新才能突破大模型推理芯片的核心瓶頸
行云聯(lián)合創(chuàng)始人、CTO余洪敏談道,高質(zhì)量大模型最核心的需求就是極其變態(tài)的內(nèi)存需求,既要帶寬,又要容量。推理芯片核心瓶頸有:顯存容量,價格高昂,只有通過軟硬件協(xié)同創(chuàng)新才能解決。
行云致力于把AI基礎(chǔ)設(shè)施從超算變成消費電子競爭,褐蟻是第一個十萬元級運行DeepSeek滿血671B、FP8非量化且對話速度在20TPS以上的解決方案,用數(shù)量級碾壓的競爭力讓全行業(yè)對AI超算祛魅。
近期行云將推出蟻群,實現(xiàn)500~1000有效并發(fā)下最高質(zhì)量模型的流暢體驗,價格在300~400萬價位,接近DeepSeek公有云的性價比;此外,計劃在明年年底推出自研GPU芯片,相比褐蟻性能將有數(shù)倍提升,集群化后,相比蟻群可以數(shù)倍提高有效并發(fā)。
▲行云集成電路聯(lián)合創(chuàng)始人、CTO余洪敏
2、安謀科技鮑敏祺:NPU如何助力端側(cè)設(shè)備突破內(nèi)存、算力、功耗三堵墻?
安謀科技產(chǎn)品總監(jiān)鮑敏祺觀察到,端側(cè)設(shè)備正逐步承擔更多AI計算任務(wù),端側(cè)AI模型在算法迭代、上下文長度擴展和模型理解力提升等方面進展迅速。
隨著模型的演進,端側(cè)AI硬件也面臨新的需求:一是算力需求持續(xù)增長,計算精度從INT向FLOAT轉(zhuǎn)變,需通過多核協(xié)同實現(xiàn)算力提升;二是大模型對帶寬要求更高,可通過提升數(shù)據(jù)本地化程度減少數(shù)據(jù)傳輸距離,從而優(yōu)化能效比;三是需要優(yōu)化硬件中向量計算與矩陣計算的配比。
為應(yīng)對“內(nèi)存墻”、“算力墻”和“功耗墻”三大挑戰(zhàn),安謀科技正升級其自研“周易”NPU產(chǎn)品,如擴展數(shù)據(jù)類型支持、新增W4A16硬件加速和DSA加速功能、提供更為豐富的算子庫等,持續(xù)驅(qū)動終端算力躍遷,助力產(chǎn)業(yè)把握端側(cè)AI“芯”機遇。
▲安謀科技產(chǎn)品總監(jiān)鮑敏祺
3、實在智能歐陽小剛:Agent端側(cè)性能超GPT-4o 10%,一體機30分鐘開箱部署
實在智能合伙人、核心算法負責人歐陽小剛提到,算力需求與場景落地的雙向倒逼,正推動智能體技術(shù)端側(cè)的探索革新。其公司行業(yè)首發(fā)的通用智能體“實在Agent”,專注跨系統(tǒng)、鏈接各類軟件的辦公流程自動化。
其自研的實在TARS大模型和TARS-VL大模型分別在垂域任務(wù)理解性能超越GPT-4o達10個百分點,GUI多模態(tài)理解能力領(lǐng)先3%,而通用能力幾乎無損;同時,該模型支持私有化部署,深度融合RPA與智能體工作流,實現(xiàn)瀏覽器、桌面應(yīng)用、移動端的無縫操作,支持一鍵流程編輯和智能體共享,降低30%重復(fù)開發(fā)成本。
歐陽小剛提到與惠普聯(lián)合打造的Z系列數(shù)字員工一體機:基于HP Z8 Fury G5工作站,得益于四塊NVIDIA 5880 Ada的強大算力,開箱30分鐘完成部署,核心業(yè)務(wù)數(shù)據(jù)全程本地處理。
▲實在智能合伙人、核心算法負責人歐陽小剛
4、白山云科技李金鋒:以邊緣計算破解AI推理時延與成本難題
白山云科技智算產(chǎn)品研發(fā)負責人李金鋒談到,AI推理面臨網(wǎng)絡(luò)時延與成本挑戰(zhàn),對邊緣計算的需求日益增長。當前的云邊端架構(gòu)依然適用:中心云集中計算,追求性能極致優(yōu)化;邊緣云在靠近用戶處提供算力,作為重要補充,現(xiàn)可處理百億參數(shù)內(nèi)大模型推理,顯著降低時延;終端算力則在保障數(shù)據(jù)隱私場景中發(fā)揮作用。
針對邊緣云節(jié)點分散帶來的算力管理難、任務(wù)調(diào)度復(fù)雜和單節(jié)點資源有限等挑戰(zhàn),李金鋒介紹可通過全網(wǎng)任務(wù)調(diào)度、彈性算力調(diào)度、模型加載優(yōu)化及單節(jié)點推理性能優(yōu)化等方式解決。
依托覆蓋全球的1700多個具備計算、存儲、安全能力的數(shù)據(jù)節(jié)點及150多個海外運營商資源,白山云能輕松升級GPU算力,有力支撐邊緣推理服務(wù)。
▲白山云科技智算產(chǎn)品研發(fā)負責人李金鋒
5、Alluxio傅正佳:用去中心化架構(gòu)方案,解決AI數(shù)據(jù)湖困境
Alluxio首席架構(gòu)師傅正佳談道,AI 數(shù)據(jù)全鏈路各環(huán)節(jié)面臨的不同難題,以及環(huán)節(jié)間數(shù)據(jù)交互導(dǎo)致的資源浪費與效率低下,其本質(zhì)都是數(shù)據(jù)湖困境的體現(xiàn)。
Alluxio介于分布式計算框架與存儲系統(tǒng)之間,可以做到對當前AI Infra“零改造無侵入”,并提升數(shù)據(jù)安全性,還可以統(tǒng)一納管數(shù)據(jù)孤島,提供高性能緩存層。Alluxio采用去中心化架構(gòu),支持100億以上對象,能夠降低數(shù)據(jù)工程復(fù)雜度與成本,提升模型迭代效率與數(shù)據(jù)方向速度。
Alluxio的核心技術(shù)包括協(xié)議轉(zhuǎn)換、數(shù)據(jù)緩存層以及虛擬數(shù)據(jù)湖等,可應(yīng)用于智駕、機器學(xué)習(xí)訓(xùn)練、智算、AI模型分發(fā)、科學(xué)計算等場景?;鶞蕼y試顯示,其性能與全球頂尖并行系統(tǒng)持平,成本更低,GPU利用率可達95%及以上。
▲Alluxio首席架構(gòu)師傅正佳
6、浩云長盛趙亮:智算時代數(shù)據(jù)中心變革,液冷、超高壓直流成大勢所趨
浩云長盛集團首席增長官(CGO)趙亮稱,隨著智算時代的到來,數(shù)據(jù)中心的算力密度不斷提升,同時,大模型推理和訓(xùn)推一體的需求也在增長。
這些變化對數(shù)據(jù)中心的供電和制冷系統(tǒng)提出了巨大挑戰(zhàn),設(shè)計和架構(gòu)需要重大調(diào)整。如今,數(shù)據(jù)中心應(yīng)配備更高的層高和更強的承重能力,以滿足密度的提升,隨之而來的散熱問題讓液冷成為必然選擇。在電力層面,能夠減少能源轉(zhuǎn)換損耗、提升電力運營效率的高壓直流技術(shù)正獲得廣泛采用。
此外,數(shù)據(jù)中心的選址也至關(guān)重要,需綜合考慮電力供應(yīng)便利性、運維便利性、算力設(shè)備梯級利用和實際應(yīng)用場景,而非簡單地將其布局在能源成本較低的地區(qū),因此把訓(xùn)推一體智算中心建設(shè)在一線城市周邊更有優(yōu)勢。
▲浩云長盛集團首席增長官CGO趙亮
7、矩向科技黃朝波:模算云破局算力浪費,毛利躍升超10倍
上海矩向科技創(chuàng)始人兼CEO黃朝波指出,當前智算中心深陷無序建設(shè)、架構(gòu)封閉、遠離業(yè)務(wù)場景三重困局,導(dǎo)致區(qū)域算力閑置、資源利用率不足。
傳統(tǒng)硬件堆砌模式已無法滿足AI爆發(fā)需求,唯有通過整合算力、模型與應(yīng)用的模算云平臺重構(gòu)價值鏈,將電力轉(zhuǎn)化為算力、模型力,并深加工為應(yīng)用賦能能力,以此來實現(xiàn)算力服務(wù)毛利的躍遷。以3000P AI算力為例,服務(wù)毛利從智算中心的1億飆升至模算云的10多億,增幅超10倍。
模算云模式以輕資產(chǎn)實現(xiàn)高產(chǎn)出:政府可統(tǒng)籌閑置算力賦能中小企業(yè),企業(yè)可通過開箱即用的MaaS服務(wù)降低AI門檻;技術(shù)上采用異構(gòu)協(xié)同,國產(chǎn)芯片覆蓋80%計算量,英偉達GPU兜底剩余需求,同時結(jié)合云邊端協(xié)同,進一步降低推理成本,縮短業(yè)務(wù)落地周期。
▲上海矩向科技創(chuàng)始人兼CEO黃朝波
8、趨動科技張增金:通用行業(yè)GPU利用率不足30%,軟件定義AI算力成必然趨勢
趨動科技技術(shù)總監(jiān)張增金指出,盡管生成式AI算力市場熱度高漲,但非生成式AI的規(guī)模仍是其兩倍,從運營層面來看,蘊藏著巨大的收入潛力(IDC 2025)。在國內(nèi)眾多智算場景中,GPU平均利用率低至5%左右,主要原因在于異構(gòu)資源分配方式粗放、調(diào)度機制缺失以及管理效率低下等問題。
采用軟件定義AI算力的模式,通過軟件對算力基礎(chǔ)設(shè)施進行重新構(gòu)建,實現(xiàn)硬件資源的按需動態(tài)調(diào)用,能夠有效解決當前異構(gòu)硬件利用率低、調(diào)度模式僵化等難題,避免因資源管理不善而引發(fā)的系統(tǒng)瓶頸。
張增金表示,未來,軟件定義將成為智算中心的關(guān)鍵發(fā)展方向。在一系列行業(yè)實踐中,趨動科技借助軟件定義技術(shù),助力某客戶將整體GPU平均利用率從8%提升至35%,峰值平均利用率從15%躍升至60%。目前,趨動科技已與數(shù)百家家來自運營商、金融、能源電力、制造業(yè)等領(lǐng)域的客戶展開了深度合作。
▲趨動科技技術(shù)總監(jiān)張增金
04.結(jié)語:中國AI算力蓬勃向前技術(shù)創(chuàng)新加速涌現(xiàn)
在中美博弈的背景下,國產(chǎn)大模型們強勢突圍,帶動了國內(nèi)AI算力需求的持續(xù)增長,算力需求發(fā)生結(jié)構(gòu)性變化、推理算力需求增速遠超預(yù)期,中國AI算力產(chǎn)業(yè)不斷迎來新的機遇和挑戰(zhàn),諸多優(yōu)秀企業(yè)通過技術(shù)創(chuàng)新破解算力難題,加速AI的產(chǎn)業(yè)化落地。
站在技術(shù)與產(chǎn)業(yè)共振的歷史節(jié)點,我們每一個人,都正在見證和參與一場激動人心的技術(shù)躍遷。隨著Agent浪潮的涌起、端側(cè)智能的加速落地、具身智能的覺醒、產(chǎn)業(yè)AI加速賦能,AGI的曙光正離我們越來越近。
中國AI算力產(chǎn)業(yè)必將乘著這股勁流揚帆起航,駛向更廣闊的AI星辰大海。
- 創(chuàng)新融通,無限可能,2025 DEMO WORLD大會將于7月3-4日在上海松江舉行
- 創(chuàng)新涌現(xiàn),規(guī)模再升級!NEPCON ASIA 2025亞洲電子展10月28-30日深圳國際會展中心邀您共襄盛舉
- NEPCON ASIA 2025亞洲電子展
- 2025全球閃存峰會
- 第11屆中國消費品CIO大會圓滿成功閉幕!第11屆中國消費品CIO大會暨第3屆中國AI大模型應(yīng)用大會正式啟動(6月,上海)
- 萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
- 長三角江蘇計量測試技術(shù)裝備展覽會
- 長三角江蘇測量控制與儀器儀表展覽會
- 中國國際工業(yè)廢水處理與資源化利用峰會暨水科技嘉年華
- 2025中國國際工業(yè)廢水處理與資源化利用峰會暨水科技嘉年華
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。