日本精品一区二区三区高清,日本片黄在线观看免费,超碰国产精品人人做人人爱

圖片1.jpg

6月26日，一場干貨爆棚的AI算力盛會，在北京燦爛盛夏中熱烈召開。

以大模型、生成式AI為代表的新一輪人工智能浪潮的滾滾向前，催生出前所未有的AI算力需求，算力是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn)力，更是人工智能發(fā)展的基石。

2025年，以DeepSeek為代表的國產(chǎn)大模型強勢突圍，在全球引爆部署熱潮和AI應(yīng)用開發(fā)熱潮，也給國內(nèi)AI算力市場注入新的活力，推動AI推理算力需求暴漲，超大規(guī)模集群鱗次櫛比，而需求的爆發(fā)也帶來諸多挑戰(zhàn)，醞釀新的行業(yè)變化。

為此，我們發(fā)起了一場聚焦前沿技術(shù)與產(chǎn)業(yè)趨勢的夏日AI聚會——2025中國AI算力大會。

從國產(chǎn)AI算力的突圍與崛起，到智算中心深層軟硬件技術(shù)創(chuàng)新解決算力落地產(chǎn)業(yè)難題，近30位重量級嘉賓與會帶來致辭、報告、演講和對話，全方位解構(gòu)DeepSeek引爆的AI算力變局，全場金句頻頻，各路大佬觀點持續(xù)碰撞擦出火花，現(xiàn)場參會人數(shù)超過850人。

在會場外的展區(qū)，Alluxio、研惠通、惠普、白山云科技、中昊芯英、中科加禾、科華數(shù)據(jù)、行云集成電路等8家企業(yè)亮出了他們的最新技術(shù)和產(chǎn)品，展區(qū)人頭攢動，交流熱情氛圍濃厚。

圖片2.jpg ▲展區(qū)

由智一科技旗下智猩猩與智東西共同發(fā)起主辦、芯東西協(xié)辦的首屆AI算力大會，圍繞AI算力產(chǎn)業(yè)變局與創(chuàng)新、AI推理算力、智算中心、智算集群異構(gòu)混訓(xùn)、超節(jié)點等話題設(shè)置議程，主會場包括高峰論壇、AI推理算力專題論壇和智算中心專題論壇；分會場為閉門制，組織了智算集群異構(gòu)混訓(xùn)技術(shù)研討會、超節(jié)點技術(shù)研討會。

圖片3.jpg ▲聯(lián)想集團Game of AI科普視頻在大會展播：聯(lián)想海神全液冷解決方案，革命性提升AI推理時代算力

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常在大會致辭環(huán)節(jié)宣布：中國AI算力大會正式成為“智領(lǐng)未來”北京人工智能系列品牌活動之一?！爸穷I(lǐng)未來”是北京市科委、中關(guān)村管委會打造的北京市人工智能領(lǐng)域的活動品牌。同樣作為“智領(lǐng)未來”北京人工智能系列品牌活動之一的中國生成式AI大會已于今年4月1日-2日圓滿舉行。龔倫常還預(yù)告了將于下半年舉行的兩場大型品牌活動：9月在上海舉辦第七屆全球AI芯片峰會，11月在深圳舉辦2025中國具身智能機器人大會。

圖片4.jpg ▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常

智算集群異構(gòu)混訓(xùn)、超節(jié)點兩場技術(shù)研討會在分會場圓滿舉辦。壁仞科技AI軟件首席架構(gòu)師丁云帆、中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所技術(shù)經(jīng)理班有容、北京智源人工智能研究院AI框架研發(fā)負責人敖玉龍、上海人工智能實驗室編譯計算與國產(chǎn)化團隊負責人裴芝林、商湯大裝置技術(shù)產(chǎn)品總監(jiān)劉葉楓在智算集群異構(gòu)混訓(xùn)技術(shù)研討會做了報告分享。

阿里云基礎(chǔ)設(shè)施異構(gòu)硬件和系統(tǒng)及解決方案資深總監(jiān)盧曉偉、中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所技術(shù)經(jīng)理王鵬、奇異摩爾首席網(wǎng)絡(luò)架構(gòu)專家葉棟、曦智科技聯(lián)合創(chuàng)始人兼首席技術(shù)官孟懷宇圍繞超節(jié)點進行了不同視角的報告分享。中信建投證券科技行業(yè)首席分析師閻貴成主持了超節(jié)點技術(shù)研討會及圓桌Panel。

圖片5.jpg ▲分會場

接下來我們將為大家?guī)碇鲿鋈笳搲?5+位分享嘉賓的演講和對話精華。

01.高峰論壇：從千芯節(jié)點到千億大模型國產(chǎn)AI芯片生態(tài)迸發(fā)旺盛活力

AI已成為數(shù)據(jù)中心增長的核心驅(qū)動力。大模型迭代拉動算力需求暴增，推動計算、存儲、網(wǎng)絡(luò)基礎(chǔ)設(shè)施全面升級。在大模型訓(xùn)練與部署需求旺盛的背景下，如何更充分地利用閑置算力，國產(chǎn)AI芯片發(fā)展到了怎樣的新階段，有哪些優(yōu)化大模型推理效果的創(chuàng)新技術(shù)？6位嘉賓分享了他們對產(chǎn)業(yè)最新風(fēng)向的觀察與探索。

1、信通院陳屹力：“算力荒”與“算力閑置”共存，算力互聯(lián)互通、AI云成焦點

中國信息通信研究院云大所副總工程師陳屹力談道，當下AI大規(guī)模應(yīng)用促使智能算力需求激增，AI 云成為全球AI浪潮角逐的焦點。其中AI云基礎(chǔ)設(shè)施需覆蓋異構(gòu)高效調(diào)度能力、一云多模能力、專家知識大腦等多方面。AI云平臺推動AI應(yīng)用的智能、便捷構(gòu)建，提升國際影響力、助力生態(tài)繁榮。

隨任務(wù)型智算應(yīng)用興起，對算力資源的定位、調(diào)度、部署效率提出更高要求。中國信通院聯(lián)合產(chǎn)業(yè)各方探索構(gòu)建算力互聯(lián)網(wǎng)，積極推進算力標識、算力調(diào)度、傳輸協(xié)議、應(yīng)用適配等方面技術(shù)研究，加快現(xiàn)有算力“局域網(wǎng)”間互聯(lián)互通，逐步建立標準體系，形成算力互聯(lián)網(wǎng)體系架構(gòu)，核心解決算力“找調(diào)用”挑戰(zhàn)，逐步形成具備智能感知、實時發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng)。

圖片6.jpg ▲中國信息通信研究院云大所副總工程師陳屹力

2、摩爾線程王華：算力需求千倍增長，大集群和FP8成為強需求

摩爾線程副總裁王華引用了一些研究數(shù)據(jù)：2020至2025年間，大模型訓(xùn)練的算力需求提升近1000倍，驅(qū)動力來自參數(shù)規(guī)模與數(shù)據(jù)量雙向增長。以DeepSeek-V3為例，其訓(xùn)練所需算力達102?級別，在萬卡集群上可將訓(xùn)練時間壓縮至13天內(nèi)完成。

為應(yīng)對算力需求，摩爾線程提供包括FP8在內(nèi)的全精度算力，有效支持混合精度訓(xùn)練，大幅提升訓(xùn)練效率；部署萬卡集群，研發(fā)完整的軟硬件棧，提供開箱即用的產(chǎn)品，快速滿足大模型訓(xùn)練的算力需求；打造豐富的集群監(jiān)控和診斷能力，針對大規(guī)模集群實現(xiàn)分鐘級故障定位。

此外，摩爾線程構(gòu)建了支持FP8、BF16、FP32等數(shù)據(jù)類型的混合精度訓(xùn)練方案，開源Torch-MUSA、MT-MegatronLM與MT-TransformerEngine等大模型訓(xùn)練組件，已完成DeepSeek-V3的混合精度訓(xùn)練復(fù)現(xiàn)。在多個模型上的實驗結(jié)果表明，其方案整體性能提升可達20%–30%，訓(xùn)練精度與業(yè)界主流保持一致。

圖片7.jpg ▲摩爾線程副總裁王華

3、中昊芯英楊龔軼凡：解讀TPU架構(gòu)創(chuàng)新設(shè)計，國產(chǎn)AI芯片如何抓住本土機遇

中昊芯英創(chuàng)始人、CEO楊龔軼凡談道，AI專用芯片是AI Infra的必然發(fā)展趨勢，TPU架構(gòu)為AI大模型而生，采用多維度計算單元來優(yōu)化數(shù)據(jù)復(fù)用，提高計算效率，并通過更激進的數(shù)據(jù)傳輸策略和更小的控制單元，給片上存儲器和運算單元留下更大空間，其可擴展性也更適合超大規(guī)模計算。

中昊芯英全自研高性能TPU架構(gòu)AI芯片“剎那”于2023年已成功流片并實現(xiàn)量產(chǎn)，其計算性能較海外某知名GPU芯片提升近1.5倍?；凇皠x那”的高性能AI服務(wù)器及大規(guī)模AI計算集群“泰則”，支持1024卡高速互聯(lián)，可支撐超千億參數(shù)大模型計算。

隨著大模型成本下移，AI芯片架構(gòu)開始深度適配動態(tài)稀疏計算范式，形成“算法定義硬件”的新研發(fā)模式。降低對CUDA生態(tài)的依賴后，國產(chǎn)Al芯片將通過提供定制化工具鏈、優(yōu)化編譯器等方式，在架構(gòu)設(shè)計上更加靈活適應(yīng)新的本土趨勢和需求。

圖片8.jpg ▲中昊芯英創(chuàng)始人、CEO楊龔軼凡

4、魔形智能徐凌杰：大模型需要“千芯”超節(jié)點，未來架構(gòu)有五大關(guān)鍵因素

魔形智能科技創(chuàng)始人、CEO徐凌杰幽默開場：“過去十年，中國最值錢的是房地產(chǎn)行業(yè)。未來最值錢的，可能還是房地產(chǎn)，只不過住的不是人，而是機器。”

研究數(shù)據(jù)顯示，全球數(shù)據(jù)中心總耗電量與單個發(fā)達國家相當。更強的大模型需要大集群，更快的大模型需要超節(jié)點，更大的高帶寬互聯(lián)域是超節(jié)點設(shè)計的核心。當前算力密度遠不夠高，要達到與人腦相當?shù)乃懔γ芏龋枰獦?gòu)建“千芯”超節(jié)點，構(gòu)建可重構(gòu)的AI算力中心。

如何構(gòu)建千芯互連網(wǎng)絡(luò)？徐凌杰總結(jié)了未來超節(jié)點架構(gòu)的5大關(guān)鍵因素：超高密度算力節(jié)點，千芯多機柜級聯(lián)背板連接，800V供電輸入，交換芯片全互聯(lián)，全覆蓋式冷卻。

他還分享了下一代算力基礎(chǔ)設(shè)施對芯片提出的3大要求：板級&封裝級靈活組合與解耦，整合光電共封裝設(shè)計，Cluster First的產(chǎn)品理念。軟硬協(xié)同將釋放超大集群的潛力。

圖片9.jpg ▲魔形智能科技創(chuàng)始人、CEO徐凌杰

5、中科加禾崔慧敏：AI編譯優(yōu)化躍升推理性能，有效擴展國產(chǎn)AI芯片生態(tài)

中國科學(xué)院計算技術(shù)研究所研究員、中科加禾創(chuàng)始人崔慧敏談道，大模型推理私有化部署需求大漲，但面臨硬件繁多、需求多元、多模部署等多重挑戰(zhàn)。

中科加禾圍繞編譯優(yōu)化構(gòu)建大模型推理的引擎和軟件棧，積累了大量實踐案例：在推理引擎中實施深度顯存優(yōu)化，有效提高顯存利用率；在大規(guī)模推理中實現(xiàn)多維并行策略，有效利用計算、訪存、通信資源；基于多項聯(lián)合優(yōu)化，推理技術(shù)在某互聯(lián)網(wǎng)廠商合作中將QPS提升50%以上，并在昇騰910B平臺私有化部署場景下有效支持128K長上下文。

長期來看，基于AI編譯技術(shù)，構(gòu)建一套底層公共的編譯支撐，能夠長期有效解決AI生態(tài)碎片化及生態(tài)融合問題。

圖片10.jpg ▲中國科學(xué)院計算技術(shù)研究所研究員、中科加禾創(chuàng)始人崔慧敏

6、趨境科技陳祥麟：千億大模型的異構(gòu)推理新路徑

趨境科技技術(shù)負責人陳祥麟分享了大模型推理的技術(shù)創(chuàng)新。他認為大模型私有化推理架構(gòu)將從傳統(tǒng)的以GPU為中心轉(zhuǎn)向全系統(tǒng)異構(gòu)協(xié)同，需要充分提升算力利用率。

團隊首創(chuàng)全系統(tǒng)異構(gòu)協(xié)同與以存換算技術(shù)，充分利用底層GPU、CPU、存儲等硬件設(shè)備算力，通過基于計算強度的offload策略、CPU/GPU的高性能算子改造、MTP等算力優(yōu)化方法，以及prefix cache等融合推理策略，提升全系統(tǒng)算力，將大模型推理門檻降低至1/10。

趨境科技與清華KVCache.AI團隊共同開源的異構(gòu)推理框架KTranformers，能夠利用單張消費級GPU+CPU異構(gòu)推理DeepSeek-671B-r1/v3，decode速度最高達到20+ tokens/s。

同時參與月之暗面、清華MADSys實驗室等多個產(chǎn)學(xué)研機構(gòu)開源的項目Mooncake，以超大規(guī)模KVCache緩存池為中心，通過以存換算的創(chuàng)新理念大幅度減少算力開銷，顯著提升了推理吞吐量。

圖片11.jpg ▲趨境科技研發(fā)負責人陳祥麟

02.高端對話：國產(chǎn)AI算力的突圍與崛起中美差距正逐步縮小

以《國產(chǎn)AI算力的突圍與崛起》為主題的高端對話，由智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁主持，中昊芯英創(chuàng)始人兼CEO楊龔軼凡，魔形智能科技創(chuàng)始人、CEO徐凌杰，中科加禾聯(lián)合創(chuàng)始人兼CTO陳龍三位嘉賓進行分享。

圖片12.jpg

張國仁談道，從2018年AI芯片峰會到如今AI算力峰會，他感觸最深的是國內(nèi)企業(yè)對自己的產(chǎn)品、公司發(fā)展都表現(xiàn)得愈發(fā)云淡風(fēng)輕。

圖片13.jpg ▲智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁

1、國產(chǎn)算力與全球差距仍然存在

面對國產(chǎn)算力在全球發(fā)展中的地位，陳龍談道，國內(nèi)廠商已掌握算力底層技術(shù)，但在PyTorch等主流訓(xùn)練框架適配方面仍處于跟隨、陪跑階段。

楊龔軼凡從硬件的設(shè)計和生產(chǎn)兩方面進行了比較：生產(chǎn)差距存在，但預(yù)測將在3-5年內(nèi)逐步縮??；而在設(shè)計層面，從學(xué)術(shù)研究、論文創(chuàng)新性等角度看，設(shè)計的差距更大。隨著模型算法收斂，更多創(chuàng)新型架構(gòu)、設(shè)計出現(xiàn)，國外諸多路線已發(fā)展到產(chǎn)品落地，國內(nèi)廠商需要共同拓展生態(tài)。

圖片14.jpg ▲中昊芯英創(chuàng)始人兼CEO楊龔軼凡

徐凌杰認為，在如何做優(yōu)秀的GPU、如何搭建生態(tài)、如何做集群等方面，中美認知差距正不斷縮小。但實際產(chǎn)業(yè)中，差距進一步擴大，企業(yè)需要從底層供應(yīng)鏈突破。

2、算力仍是資源導(dǎo)向型市場

對于國產(chǎn)算力的市場化，徐凌杰判斷，政府、資源導(dǎo)向型的現(xiàn)狀未來幾年不會有很大改變，芯片晶圓、制程以及芯片創(chuàng)企在國產(chǎn)生態(tài)中的成長，都需要政府扶持。芯片公司的機會是通過更強互聯(lián)、集群打造差異化，找到商業(yè)化落腳點。

楊龔軼凡同樣認為，資源導(dǎo)向型走向市場導(dǎo)向型是一個過程，在半導(dǎo)體行業(yè)，老的生產(chǎn)制程永遠比新的生產(chǎn)制程性價比低，生產(chǎn)制程每迭代一次會有4倍的性價比提升，這就導(dǎo)致純國產(chǎn)芯片的性價比更低，需要政府扶持拉通生產(chǎn)工藝的產(chǎn)業(yè)鏈。

陳龍從應(yīng)用層面進行分析，談到國家的扶持很必要，企業(yè)通過軟硬件優(yōu)化降低了部署成本，但消費側(cè)拉動還不夠強，現(xiàn)狀是上一代芯片尚沒有完全落地應(yīng)用，下一代芯片已經(jīng)出來了，因此核心是要發(fā)掘更有價值的應(yīng)用。

圖片15.jpg ▲中科加禾聯(lián)合創(chuàng)始人兼CTO陳龍

3、專用芯片、編譯技術(shù)、超節(jié)點，是未來發(fā)展方向

楊龔軼凡堅信專用芯片是未來的發(fā)展方向，在通用性需求大幅降低的情況下，可以拋棄部分通用性，增加芯片核心的性能和性價比。越專越好，是在滿足一定可控性和變化下的結(jié)果。

圍繞編譯技術(shù)在解決國產(chǎn)芯片面臨的風(fēng)險，陳龍認為，它是將專家的經(jīng)驗泛化、普適化的一種技術(shù)手段。編譯技術(shù)最開始產(chǎn)生是為了彌補人的思維和機器能接受信息之間的鴻溝，使開發(fā)效率提升上百倍。

徐凌杰著重談到超節(jié)點的發(fā)展方向，在大模型領(lǐng)域，類似MoE的創(chuàng)新結(jié)合超節(jié)點會有更大收益，即更大的問題用更大的集群解決，更大的集群反哺系統(tǒng)，從而做出更大的模型。

圖片16.jpg ▲魔形智能科技創(chuàng)始人、CEO徐凌杰

4、算力產(chǎn)業(yè)格局未定

談到全球算力產(chǎn)業(yè)的產(chǎn)業(yè)格局，陳龍認為，雖然國內(nèi)巨頭有積累優(yōu)勢，但產(chǎn)業(yè)規(guī)模足夠大，且需求多元化，將來企業(yè)將百花齊放。

楊龔軼凡的觀點更為激進：首先，3-5年內(nèi)形成產(chǎn)業(yè)格局的可能性不高，目前仍是企業(yè)相互競爭、高速發(fā)展變革的過程；其次，資源型市場的天然屬性決定了其很難形成壟斷，且巨頭穿越周期能力弱，因此AI產(chǎn)業(yè)爆發(fā)后市場格局會洗牌，初創(chuàng)公司或許會通過更好的組織形式去適應(yīng)產(chǎn)業(yè)發(fā)展。

行業(yè)的重要性、資本周期發(fā)展對產(chǎn)業(yè)發(fā)展都會有影響。徐凌杰相信，算力變得越來越有吸引力，自然會有更多的錢涌入，會出現(xiàn)巨頭被沖擊、新生勢力冒出的場景。創(chuàng)企和巨頭需要找準自己的定位，通過“整合”變成更強實體可能是一條發(fā)展路徑。

如今中國算力規(guī)模已在全球排名第二，被預(yù)測有望影響全球AI 競賽格局。陳龍認為，AI算力市場規(guī)模和國家GDP發(fā)展成正比關(guān)系，當國家GDP反超或許是國產(chǎn)算力格局更進一步的機會。楊龔軼凡提到投入產(chǎn)出比，目前美國和中國算力開銷差10倍，當投入量逐步趕上才會有變化。徐凌杰認為未來當AI賦能千行百業(yè)，算力真正變成生產(chǎn)力時，就是一個巨大的機會。

03.專題論壇：從軟硬協(xié)同到端邊云協(xié)同底層技術(shù)創(chuàng)新突破AI算力瓶頸

下午場火熱繼續(xù)，在AI推理算力專題論壇和智算中心專題論壇中，來自行云集成電路、安謀科技、實在智能、白山云科技、Alluxio、浩云長盛集團、上海矩向科技、趨動科技的8位嘉賓帶來了精彩演講。

如何突破大模型推理芯片的核心瓶頸、如何實現(xiàn)出色的端側(cè)模型性能？超大規(guī)模智算中心面臨的數(shù)據(jù)、成本功耗、算力利用率等方面的一系列難題要如何破解？我們都將找到答案。

1、行云余洪敏：只有軟硬件協(xié)同創(chuàng)新才能突破大模型推理芯片的核心瓶頸

行云聯(lián)合創(chuàng)始人、CTO余洪敏談道，高質(zhì)量大模型最核心的需求就是極其變態(tài)的內(nèi)存需求，既要帶寬，又要容量。推理芯片核心瓶頸有：顯存容量，價格高昂，只有通過軟硬件協(xié)同創(chuàng)新才能解決。

行云致力于把AI基礎(chǔ)設(shè)施從超算變成消費電子競爭，褐蟻是第一個十萬元級運行DeepSeek滿血671B、FP8非量化且對話速度在20TPS以上的解決方案，用數(shù)量級碾壓的競爭力讓全行業(yè)對AI超算祛魅。

近期行云將推出蟻群，實現(xiàn)500~1000有效并發(fā)下最高質(zhì)量模型的流暢體驗，價格在300~400萬價位，接近DeepSeek公有云的性價比；此外，計劃在明年年底推出自研GPU芯片，相比褐蟻性能將有數(shù)倍提升，集群化后，相比蟻群可以數(shù)倍提高有效并發(fā)。

圖片17.jpg ▲行云集成電路聯(lián)合創(chuàng)始人、CTO余洪敏

2、安謀科技鮑敏祺：NPU如何助力端側(cè)設(shè)備突破內(nèi)存、算力、功耗三堵墻？

安謀科技產(chǎn)品總監(jiān)鮑敏祺觀察到，端側(cè)設(shè)備正逐步承擔更多AI計算任務(wù)，端側(cè)AI模型在算法迭代、上下文長度擴展和模型理解力提升等方面進展迅速。

隨著模型的演進，端側(cè)AI硬件也面臨新的需求：一是算力需求持續(xù)增長，計算精度從INT向FLOAT轉(zhuǎn)變，需通過多核協(xié)同實現(xiàn)算力提升；二是大模型對帶寬要求更高，可通過提升數(shù)據(jù)本地化程度減少數(shù)據(jù)傳輸距離，從而優(yōu)化能效比；三是需要優(yōu)化硬件中向量計算與矩陣計算的配比。

為應(yīng)對“內(nèi)存墻”、“算力墻”和“功耗墻”三大挑戰(zhàn)，安謀科技正升級其自研“周易”NPU產(chǎn)品，如擴展數(shù)據(jù)類型支持、新增W4A16硬件加速和DSA加速功能、提供更為豐富的算子庫等，持續(xù)驅(qū)動終端算力躍遷，助力產(chǎn)業(yè)把握端側(cè)AI“芯”機遇。

圖片18.jpg ▲安謀科技產(chǎn)品總監(jiān)鮑敏祺

3、實在智能歐陽小剛：Agent端側(cè)性能超GPT-4o 10%，一體機30分鐘開箱部署

實在智能合伙人、核心算法負責人歐陽小剛提到，算力需求與場景落地的雙向倒逼，正推動智能體技術(shù)端側(cè)的探索革新。其公司行業(yè)首發(fā)的通用智能體“實在Agent”，專注跨系統(tǒng)、鏈接各類軟件的辦公流程自動化。

其自研的實在TARS大模型和TARS-VL大模型分別在垂域任務(wù)理解性能超越GPT-4o達10個百分點，GUI多模態(tài)理解能力領(lǐng)先3%，而通用能力幾乎無損；同時，該模型支持私有化部署，深度融合RPA與智能體工作流，實現(xiàn)瀏覽器、桌面應(yīng)用、移動端的無縫操作，支持一鍵流程編輯和智能體共享，降低30%重復(fù)開發(fā)成本。

歐陽小剛提到與惠普聯(lián)合打造的Z系列數(shù)字員工一體機：基于HP Z8 Fury G5工作站，得益于四塊NVIDIA 5880 Ada的強大算力，開箱30分鐘完成部署，核心業(yè)務(wù)數(shù)據(jù)全程本地處理。

圖片19.jpg ▲實在智能合伙人、核心算法負責人歐陽小剛

4、白山云科技李金鋒：以邊緣計算破解AI推理時延與成本難題

白山云科技智算產(chǎn)品研發(fā)負責人李金鋒談到，AI推理面臨網(wǎng)絡(luò)時延與成本挑戰(zhàn)，對邊緣計算的需求日益增長。當前的云邊端架構(gòu)依然適用：中心云集中計算，追求性能極致優(yōu)化；邊緣云在靠近用戶處提供算力，作為重要補充，現(xiàn)可處理百億參數(shù)內(nèi)大模型推理，顯著降低時延；終端算力則在保障數(shù)據(jù)隱私場景中發(fā)揮作用。

針對邊緣云節(jié)點分散帶來的算力管理難、任務(wù)調(diào)度復(fù)雜和單節(jié)點資源有限等挑戰(zhàn)，李金鋒介紹可通過全網(wǎng)任務(wù)調(diào)度、彈性算力調(diào)度、模型加載優(yōu)化及單節(jié)點推理性能優(yōu)化等方式解決。

依托覆蓋全球的1700多個具備計算、存儲、安全能力的數(shù)據(jù)節(jié)點及150多個海外運營商資源，白山云能輕松升級GPU算力，有力支撐邊緣推理服務(wù)。

圖片20.jpg ▲白山云科技智算產(chǎn)品研發(fā)負責人李金鋒

5、Alluxio傅正佳：用去中心化架構(gòu)方案，解決AI數(shù)據(jù)湖困境

Alluxio首席架構(gòu)師傅正佳談道，AI 數(shù)據(jù)全鏈路各環(huán)節(jié)面臨的不同難題，以及環(huán)節(jié)間數(shù)據(jù)交互導(dǎo)致的資源浪費與效率低下，其本質(zhì)都是數(shù)據(jù)湖困境的體現(xiàn)。

Alluxio介于分布式計算框架與存儲系統(tǒng)之間，可以做到對當前AI Infra“零改造無侵入”，并提升數(shù)據(jù)安全性，還可以統(tǒng)一納管數(shù)據(jù)孤島，提供高性能緩存層。Alluxio采用去中心化架構(gòu)，支持100億以上對象，能夠降低數(shù)據(jù)工程復(fù)雜度與成本，提升模型迭代效率與數(shù)據(jù)方向速度。

Alluxio的核心技術(shù)包括協(xié)議轉(zhuǎn)換、數(shù)據(jù)緩存層以及虛擬數(shù)據(jù)湖等，可應(yīng)用于智駕、機器學(xué)習(xí)訓(xùn)練、智算、AI模型分發(fā)、科學(xué)計算等場景?；鶞蕼y試顯示，其性能與全球頂尖并行系統(tǒng)持平，成本更低，GPU利用率可達95%及以上。

圖片21.jpg ▲Alluxio首席架構(gòu)師傅正佳

6、浩云長盛趙亮：智算時代數(shù)據(jù)中心變革，液冷、超高壓直流成大勢所趨

浩云長盛集團首席增長官（CGO）趙亮稱，隨著智算時代的到來，數(shù)據(jù)中心的算力密度不斷提升，同時，大模型推理和訓(xùn)推一體的需求也在增長。

這些變化對數(shù)據(jù)中心的供電和制冷系統(tǒng)提出了巨大挑戰(zhàn)，設(shè)計和架構(gòu)需要重大調(diào)整。如今，數(shù)據(jù)中心應(yīng)配備更高的層高和更強的承重能力，以滿足密度的提升，隨之而來的散熱問題讓液冷成為必然選擇。在電力層面，能夠減少能源轉(zhuǎn)換損耗、提升電力運營效率的高壓直流技術(shù)正獲得廣泛采用。

此外，數(shù)據(jù)中心的選址也至關(guān)重要，需綜合考慮電力供應(yīng)便利性、運維便利性、算力設(shè)備梯級利用和實際應(yīng)用場景，而非簡單地將其布局在能源成本較低的地區(qū)，因此把訓(xùn)推一體智算中心建設(shè)在一線城市周邊更有優(yōu)勢。

圖片22.jpg ▲浩云長盛集團首席增長官CGO趙亮

7、矩向科技黃朝波：模算云破局算力浪費，毛利躍升超10倍

上海矩向科技創(chuàng)始人兼CEO黃朝波指出，當前智算中心深陷無序建設(shè)、架構(gòu)封閉、遠離業(yè)務(wù)場景三重困局，導(dǎo)致區(qū)域算力閑置、資源利用率不足。

傳統(tǒng)硬件堆砌模式已無法滿足AI爆發(fā)需求，唯有通過整合算力、模型與應(yīng)用的模算云平臺重構(gòu)價值鏈，將電力轉(zhuǎn)化為算力、模型力，并深加工為應(yīng)用賦能能力，以此來實現(xiàn)算力服務(wù)毛利的躍遷。以3000P AI算力為例，服務(wù)毛利從智算中心的1億飆升至模算云的10多億，增幅超10倍。

模算云模式以輕資產(chǎn)實現(xiàn)高產(chǎn)出：政府可統(tǒng)籌閑置算力賦能中小企業(yè)，企業(yè)可通過開箱即用的MaaS服務(wù)降低AI門檻；技術(shù)上采用異構(gòu)協(xié)同，國產(chǎn)芯片覆蓋80%計算量，英偉達GPU兜底剩余需求，同時結(jié)合云邊端協(xié)同，進一步降低推理成本，縮短業(yè)務(wù)落地周期。

圖片23.jpg ▲上海矩向科技創(chuàng)始人兼CEO黃朝波

8、趨動科技張增金：通用行業(yè)GPU利用率不足30%，軟件定義AI算力成必然趨勢

趨動科技技術(shù)總監(jiān)張增金指出，盡管生成式AI算力市場熱度高漲，但非生成式AI的規(guī)模仍是其兩倍，從運營層面來看，蘊藏著巨大的收入潛力（IDC 2025）。在國內(nèi)眾多智算場景中，GPU平均利用率低至5%左右，主要原因在于異構(gòu)資源分配方式粗放、調(diào)度機制缺失以及管理效率低下等問題。

采用軟件定義AI算力的模式，通過軟件對算力基礎(chǔ)設(shè)施進行重新構(gòu)建，實現(xiàn)硬件資源的按需動態(tài)調(diào)用，能夠有效解決當前異構(gòu)硬件利用率低、調(diào)度模式僵化等難題，避免因資源管理不善而引發(fā)的系統(tǒng)瓶頸。

張增金表示，未來，軟件定義將成為智算中心的關(guān)鍵發(fā)展方向。在一系列行業(yè)實踐中，趨動科技借助軟件定義技術(shù)，助力某客戶將整體GPU平均利用率從8%提升至35%，峰值平均利用率從15%躍升至60%。目前，趨動科技已與數(shù)百家家來自運營商、金融、能源電力、制造業(yè)等領(lǐng)域的客戶展開了深度合作。

圖片24.jpg ▲趨動科技技術(shù)總監(jiān)張增金

04.結(jié)語：中國AI算力蓬勃向前技術(shù)創(chuàng)新加速涌現(xiàn)

在中美博弈的背景下，國產(chǎn)大模型們強勢突圍，帶動了國內(nèi)AI算力需求的持續(xù)增長，算力需求發(fā)生結(jié)構(gòu)性變化、推理算力需求增速遠超預(yù)期，中國AI算力產(chǎn)業(yè)不斷迎來新的機遇和挑戰(zhàn)，諸多優(yōu)秀企業(yè)通過技術(shù)創(chuàng)新破解算力難題，加速AI的產(chǎn)業(yè)化落地。

站在技術(shù)與產(chǎn)業(yè)共振的歷史節(jié)點，我們每一個人，都正在見證和參與一場激動人心的技術(shù)躍遷。隨著Agent浪潮的涌起、端側(cè)智能的加速落地、具身智能的覺醒、產(chǎn)業(yè)AI加速賦能，AGI的曙光正離我們越來越近。

中國AI算力產(chǎn)業(yè)必將乘著這股勁流揚帆起航，駛向更廣闊的AI星辰大海。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

萬字回顧首屆中國AI算力大會！15+位大咖主會場演講精華爆棚，來沒來都值得收藏

下一篇

萬字回顧首屆中國AI算力大會！15+位大咖主會場演講精華爆棚，來沒來都值得收藏

下一篇

萬字回顧首屆中國AI算力大會！15+位大咖主會場演講精華爆棚，來沒來都值得收藏