“大模型已經(jīng)進(jìn)入下半場?!痹谇安痪玫穆?lián)想創(chuàng)新科技大會(huì)(Lenovo Tech World 2025)上,中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏做出了如此論斷。
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏
轉(zhuǎn)場的關(guān)鍵時(shí)間點(diǎn)是2024年12月。從那以后,深度求索(DeepSeek)接連發(fā)布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模態(tài)大模型,達(dá)到了OpenAI同類型模型的同等水平,訓(xùn)練成本卻只有5%,運(yùn)行成本更是只有3%。
如果說大模型的上半場是卷算力的狂飆突進(jìn)的話,下半場則轉(zhuǎn)入了效率為先的精耕細(xì)作。由于外部環(huán)境的變化,這種風(fēng)格的切換,在中國市場尤甚。而這,當(dāng)然也給中國的AI基礎(chǔ)設(shè)施供應(yīng)商帶來了全新的挑戰(zhàn)。
新的賽場、新的規(guī)則、新的范式,誰能抓住新的機(jī)會(huì)?
最好的時(shí)代
正如何寶宏所言,大模型的下半場,最大的變化就是在上半場已經(jīng)發(fā)揚(yáng)光大的、追求“高性能”的高端賽道之外,又出現(xiàn)了一條追求“高性價(jià)比”的普惠賽道。
由于普惠賽道的出現(xiàn),使得AI基礎(chǔ)設(shè)施市場出現(xiàn)了“杰文斯悖論”:當(dāng)技術(shù)進(jìn)步提升資源利用效率后,資源消耗量非但未減少,反而進(jìn)一步增長。
這是最好的時(shí)代。IDC數(shù)據(jù)顯示,2024年全球人工智能服務(wù)器市場規(guī)模預(yù)計(jì)為1251億美元,2025年將增至1587億美元,2028年有望達(dá)到2227億美元,其中生成式人工智能服務(wù)器占比將從2025年的29.6%提升至2028年的37.7%。
中國市場的情況還要更為樂觀。同樣是根據(jù)IDC的預(yù)測,2023-2028年期間,中國智能算力規(guī)模的五年年復(fù)合增長率預(yù)計(jì)達(dá)到46.2%,通用算力規(guī)模預(yù)計(jì)達(dá)到18.8%。較上一版本的預(yù)期值33.9%和16.6%,均有顯著提升。
最壞的時(shí)代
這也是最壞的時(shí)代。如今,由于大模型應(yīng)用客戶需求的巨大變化,也給所有的中國AI基礎(chǔ)設(shè)施供應(yīng)商提出了新的要求,他們必須盡快適應(yīng)巨變并做到“四化”:
1.多元化:由于人工智能在國內(nèi)的應(yīng)用場景較為復(fù)雜,同時(shí)受到地緣、供應(yīng)鏈等因素影響,人工智能芯片類型與廠商呈現(xiàn)出多元化的趨勢,GPU、CPU、DSA、ASIC等多種芯片被廣泛應(yīng)用在人工智能的訓(xùn)練與推理中,不少場景實(shí)現(xiàn)了多類型芯片的混合使用。在芯片廠商方面,諸多國內(nèi)廠商開始嶄露頭角,提供了大規(guī)模的算力集群方案。
2.服務(wù)化:為滿足不同的算力需求,人工智能算力服務(wù)不斷革新。生成式人工智能IaaS服務(wù)可為企業(yè)按需提供容量,支持靈活的模型訓(xùn)練和內(nèi)容生成;算力租賃使用戶按需租賃計(jì)算資源,降低成本并提高靈活性;算力共享通過資源池化和動(dòng)態(tài)調(diào)度,實(shí)現(xiàn)資源共享和成本分?jǐn)偅恢撬阒行募筛咝阅艿挠?jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源,提供高可用的一站式服務(wù),支持大規(guī)模人工智能應(yīng)用。
3.場景化:人工智能算力基礎(chǔ)設(shè)施的多樣化,旨在應(yīng)對不同行業(yè)和應(yīng)用場景的多樣化需求。例如,金融行業(yè)需要高安全性和低延遲的計(jì)算環(huán)境,醫(yī)療行業(yè)需要處理大量醫(yī)學(xué)影像數(shù)據(jù),制造業(yè)需要實(shí)現(xiàn)實(shí)時(shí)生產(chǎn)優(yōu)化,互聯(lián)網(wǎng)行業(yè)需要處理大規(guī)模用戶數(shù)據(jù)和內(nèi)容推薦。這些需求對底層架構(gòu)提出了高性能、低延遲、高安全性、可擴(kuò)展性和成本效益等新要求。
4.綠色化:在雙碳目標(biāo)的指引下,全國范圍內(nèi)對綠色發(fā)展的重視程度和投資力度不斷加大。政策上來說,一方面國家對于數(shù)據(jù)中心的新建審批及能耗要求上持續(xù)趨嚴(yán);另一方面也會(huì)通過諸如電費(fèi)分段計(jì)價(jià)等引導(dǎo)數(shù)據(jù)中心綠色化發(fā)展。
這樣的新時(shí)代,中國的AI基礎(chǔ)設(shè)施供應(yīng)商該如何應(yīng)對?
“四策”對“四化”
針對AI基礎(chǔ)設(shè)施的“四化”,中國的AI基礎(chǔ)設(shè)施供應(yīng)商們同樣也在行動(dòng)起來,以“四策”來應(yīng)對。
1.支持異構(gòu)計(jì)算。如今在全球,異構(gòu)計(jì)算大行其道;在中國市場,這個(gè)趨勢則更加明顯。IDC預(yù)測,到2029年中國加速服務(wù)器市場規(guī)模將超過千億美元,其中非GPU服務(wù)器市場規(guī)模將接近50%。即使是在超過市場規(guī)模一半的GPU服務(wù)器市場,由于中國特有的環(huán)境,NVIDIA不再一枝獨(dú)秀,而是出現(xiàn)了天數(shù)智芯、沐曦、摩爾線程、華為、燧原科技、壁仞科技、海光信息、寒武紀(jì)等諸多國產(chǎn)芯片廠商。對于中國AI基礎(chǔ)設(shè)施供應(yīng)商來說,關(guān)鍵就是要做好這些芯片廠商的適配。
2.算存網(wǎng)齊頭并進(jìn)。對于如今的AI基礎(chǔ)設(shè)施提供商來說,計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)能力必須同時(shí)提升。他們必須采用先進(jìn)的計(jì)算架構(gòu),提升單計(jì)算節(jié)點(diǎn)性能,提高計(jì)算效率;還需要優(yōu)化內(nèi)存層次結(jié)構(gòu),減少數(shù)據(jù)傳輸延遲,增強(qiáng)數(shù)據(jù)處理速度;還得利用智能調(diào)度算法合理分配計(jì)算任務(wù),優(yōu)化集群管理方面,確保資源高效利用。面對智算客戶的時(shí)候,他們還需要交付算存網(wǎng)一站式解決方案。
3.打造場景化產(chǎn)品。當(dāng)然,AI基礎(chǔ)設(shè)施提供商更需要針對大模型的各種應(yīng)用場景,打造針對性的產(chǎn)品。例如,針對目前高速增長的推理場景,推出更適合推理的AI服務(wù)器;針對國內(nèi)客戶希望盡快用上滿血版DeepSeek大模型并進(jìn)行本地化部署的場景,發(fā)布DeepSeek一體機(jī)產(chǎn)品。
4.普及綠色技術(shù)。為了盡快實(shí)現(xiàn)雙碳目標(biāo),業(yè)界積極探索破局之道。其中,液冷技術(shù)作為關(guān)鍵突破,可以顯著提升計(jì)算密度,降低數(shù)據(jù)中心的總能耗。通過全棧液冷方案,將推動(dòng)算力設(shè)施在計(jì)算節(jié)點(diǎn)層面、機(jī)柜層面以及數(shù)據(jù)中心層面的綠色化和低碳化轉(zhuǎn)型。
六大創(chuàng)新技術(shù)
從聯(lián)想創(chuàng)新科技大會(huì)上,我們已經(jīng)看到,聯(lián)想已經(jīng)為下半場做好了充足的準(zhǔn)備。
面對AI技術(shù)的持續(xù)創(chuàng)新和用戶需求的快速變化,聯(lián)想從算力性能與效能、核心算法、算力服務(wù)等多個(gè)維度再次發(fā)布六大創(chuàng)新技術(shù):
1.AI推理加速算法集。針對大模型引發(fā)的推理需求爆發(fā),AI推理加速算法集結(jié)合了MLA-多頭潛在注意力機(jī)制、投機(jī)推理等業(yè)界新興方法,以及聯(lián)想長期優(yōu)化的混合精度量化、分布式并行等算法,為推理加速打造強(qiáng)大的工具箱,助力用戶突破推理性能極限,實(shí)現(xiàn)AI推理性能提升5-10倍。同時(shí),相對于業(yè)界最優(yōu)的社區(qū)方案,聯(lián)想的AI推理性能保持20%以上的優(yōu)勢。
2.AI編譯優(yōu)化器。針對各個(gè)行業(yè)對大模型后訓(xùn)練與推理結(jié)合的前沿需求,AI編譯優(yōu)化器在訓(xùn)練或推理過程中能夠自動(dòng)化替換高效算子、優(yōu)化計(jì)算路徑,并進(jìn)行自動(dòng)重編譯,大幅簡化復(fù)雜的AI計(jì)算過程,在提升AI訓(xùn)推效率的同時(shí),還實(shí)現(xiàn)了降低訓(xùn)練和推理計(jì)算開銷各15%以上。
3.AI訓(xùn)推慢節(jié)點(diǎn)故障預(yù)測與自愈系統(tǒng)。面對大規(guī)模AI計(jì)算集群的運(yùn)維需求,該系統(tǒng)通過對集群異步實(shí)時(shí)狀態(tài)監(jiān)測與全面故障分析,以AI預(yù)測AI故障,在節(jié)點(diǎn)性能下降前發(fā)現(xiàn)問題,并自動(dòng)化解決故障,實(shí)現(xiàn)故障自愈時(shí)間控制在百卡秒級、千卡分鐘級、萬卡十分鐘級。
4.專家并行通信算法。面向AI計(jì)算集群不斷提升的網(wǎng)絡(luò)能力需求,該算法通過對通信計(jì)算原語、訪存方式和網(wǎng)絡(luò)路由算法的協(xié)同優(yōu)化,實(shí)現(xiàn)了推理延時(shí)降低3倍以上,網(wǎng)絡(luò)帶寬利用率從50%提升至90%。
5.“飛魚”仿生散熱設(shè)計(jì)與浸沒式制冷系統(tǒng)。在液冷領(lǐng)域,該系統(tǒng)成功突破了散熱器性能瓶頸,最大支持功耗提升20%;同時(shí),聯(lián)想還發(fā)布了“雙循環(huán)”相變浸沒制冷系統(tǒng),通過創(chuàng)新的外接單相換熱器設(shè)計(jì),實(shí)現(xiàn)散熱能力較傳統(tǒng)方案翻倍提升,系統(tǒng)PUE低至1.035。
6.算力服務(wù)“成本-效能”雙優(yōu)運(yùn)營系統(tǒng)。該系統(tǒng)從服務(wù)服務(wù)方面幫助提升用戶運(yùn)營效能,優(yōu)化運(yùn)營成本。
在支持異構(gòu)計(jì)算方面,聯(lián)想也做得足夠深入?!癉eepSeek大模型也好,通義千問3也好,它們的滿血版在一些國產(chǎn)GPU上都已經(jīng)跑通了,不僅僅是跑通,還做了調(diào)優(yōu)。”聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)部戰(zhàn)略管理部總監(jiān)黃山透露,聯(lián)想與8大國產(chǎn)GPU廠商開展了廣泛的合作,甚至深入到了算子級別。
聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)部戰(zhàn)略管理部總監(jiān)黃山
兩大重磅升級
除了發(fā)布六大創(chuàng)新技術(shù)之外,聯(lián)想還宣布了兩大重磅升級:
第一大重磅升級是發(fā)布了聯(lián)想萬全異構(gòu)智算平臺3.0版本,新增了AI推理加速算法集、AI編譯優(yōu)化器、AI訓(xùn)推慢節(jié)點(diǎn)故障與自愈系統(tǒng)、專家并行通信算法等四大突破性創(chuàng)新技術(shù),直擊大模型應(yīng)用落地的關(guān)鍵痛點(diǎn),從而為DeepSeek R1/V3等千億級大模型提供更高效的運(yùn)行環(huán)境,并不斷突破算力效率極限。
在該平臺的加持下,實(shí)測單機(jī)部署DeepSeek 671B模型吞吐突破12000 tokens/s,在極限場景下更是創(chuàng)下37000+ tokens/s的行業(yè)新紀(jì)錄,充分展示了聯(lián)想萬全異構(gòu)智算平臺的技術(shù)領(lǐng)先性。
第二大重磅升級,是聯(lián)想AI基礎(chǔ)設(shè)施從計(jì)算力、存儲(chǔ)力到運(yùn)載力的全線升級:
1.計(jì)算力。如今,隨著AI應(yīng)用進(jìn)入百花齊放的后訓(xùn)練時(shí)代,聯(lián)想提出打造“更強(qiáng)大、更穩(wěn)定、更高效、更綠色”的算力基礎(chǔ)設(shè)施,并針對業(yè)務(wù)數(shù)據(jù)到智能業(yè)務(wù)全過程的三個(gè)關(guān)鍵應(yīng)用場景——數(shù)據(jù)處理、模型訓(xùn)練和推理應(yīng)用分別進(jìn)行優(yōu)化,形成數(shù)據(jù)處理算力服務(wù)器、AI訓(xùn)練算力服務(wù)器、推理應(yīng)用算力服務(wù)器三大家族。
在這次聯(lián)想創(chuàng)新科技大會(huì)上,聯(lián)想重磅推出基于英特爾?至強(qiáng)?6處理器的全新算力服務(wù)器家族,包括聯(lián)想問天 WA7880a家族在內(nèi)的AI訓(xùn)練算力服務(wù)器家族、聯(lián)想ThinkSystem SC750 V4在內(nèi)的數(shù)據(jù)處理算力服務(wù)器家族;聯(lián)想問天 WA5480 G5、WR5220 G5、聯(lián)想ThinkSystem SR650 V4、SR650a V4、SR630 V4在內(nèi)的推理應(yīng)用算力服務(wù)器家族。面向不同的AI應(yīng)用場景,全新算力服務(wù)器家族進(jìn)行了針對性優(yōu)化,充分釋放AI服務(wù)器的算力潛能。
2.存儲(chǔ)力。聯(lián)想最新發(fā)布了凌拓全新存儲(chǔ)產(chǎn)品家族,以及具備本地自研、自有知識產(chǎn)權(quán)、自主可控三大特征的聯(lián)想存儲(chǔ)新品牌聯(lián)想問天。聯(lián)想凌拓從數(shù)據(jù)管理到存儲(chǔ)架構(gòu)均進(jìn)行了全方位升級,包括聯(lián)想問天DXN AI 存儲(chǔ)解決方案、DXN2000系列、DXN 全閃系列,Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一體機(jī)在內(nèi)的聯(lián)想凌拓全新存儲(chǔ)產(chǎn)品家族,滿足AI存儲(chǔ)時(shí)代各個(gè)行業(yè)的需求。
3.運(yùn)載力。聯(lián)想通過RoCE/IB多架構(gòu)融合及低延遲優(yōu)化技術(shù),構(gòu)建了覆蓋多種規(guī)模AI算力集群的智能網(wǎng)絡(luò)體系。其數(shù)據(jù)網(wǎng)絡(luò)產(chǎn)品兼容多種主流AI網(wǎng)絡(luò)架構(gòu)。最新發(fā)布的高密度400G交換機(jī)聯(lián)想問天NE8770-64QC專為AI場景深度優(yōu)化。同步亮相的還包括兩款戰(zhàn)略級新品——面向下一代融合網(wǎng)絡(luò)的多業(yè)務(wù)核心交換機(jī)聯(lián)想問天NE7550G-8C,以及支持超大規(guī)模組網(wǎng)的新一代高性能核心交換機(jī)聯(lián)想問天NE9770G-4C。
此外,在軟件及超融合領(lǐng)域,聯(lián)想還升級了AIO V6系列產(chǎn)品和聯(lián)想問天WX系列虛擬化超融合8.0.2版本。聯(lián)想AIO超融合解決方案已實(shí)現(xiàn)2000+企業(yè)級客戶部署,累計(jì)支撐超20000個(gè)核心業(yè)務(wù)系統(tǒng)平穩(wěn)運(yùn)行。
從以上六大創(chuàng)新技術(shù)和兩大重磅升級可以看出,在應(yīng)對大模型下半場的“四策”(支持異構(gòu)計(jì)算、算存網(wǎng)齊頭并進(jìn)、打造場景化產(chǎn)品、普及綠色技術(shù))上,聯(lián)想已經(jīng)走在了行業(yè)的最前列。
成為領(lǐng)軍者
新的時(shí)代,也意味著新的機(jī)會(huì)。聯(lián)想集團(tuán)副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬表示:“在各種創(chuàng)新疊加下,算力已不再僅僅是AI落地的底座,相反,正作為新興的技術(shù)引擎推動(dòng)中國AI新時(shí)代的落地。”
聯(lián)想集團(tuán)副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬
如今的聯(lián)想,已經(jīng)開始收獲果實(shí)。眾所周知,在AI基礎(chǔ)設(shè)施當(dāng)中,最主力的產(chǎn)品就是AI服務(wù)器。聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器產(chǎn)品部總經(jīng)理周韜透露,去年聯(lián)想服務(wù)器在中國市場創(chuàng)造了180%的驚人增速。究其原因,就是在AI服務(wù)器市場獲得了大豐收?!叭ツ甑靡嬗贏I的大發(fā)展,我們在互聯(lián)網(wǎng)、電信運(yùn)營商、制造業(yè)、智算中心等領(lǐng)域都有比較大的突破。”
聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器產(chǎn)品部總經(jīng)理周韜
就在前不久,聯(lián)想發(fā)布了2024/2025財(cái)年年報(bào)。其中,基礎(chǔ)設(shè)施方案業(yè)務(wù)集團(tuán)(ISG)表現(xiàn)優(yōu)異,營收同比暴漲了63%,并在下半財(cái)年成功扭虧為盈。
如今,六大創(chuàng)新技術(shù)、兩大重磅升級的發(fā)布,將進(jìn)一步夯實(shí)聯(lián)想在AI基礎(chǔ)設(shè)施領(lǐng)域的基礎(chǔ),并向著廣為廣闊的市場進(jìn)發(fā)。周韜表示,在互聯(lián)網(wǎng)這個(gè)最重要的細(xì)分市場,聯(lián)想除了繼續(xù)擴(kuò)大在Tier1的市場份額之外,還要進(jìn)軍Tier2。
面向AI的新十年,聯(lián)想已經(jīng)開啟創(chuàng)業(yè)5.0時(shí)代。聯(lián)想集團(tuán)董事長兼CEO楊元慶表示,超級智能體時(shí)代,聯(lián)想將致力于助力合作伙伴率先擁抱AI,攜手把握這波機(jī)遇,深挖并服務(wù)好客戶的人工智能新需求,成為行業(yè)的領(lǐng)軍者。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 小米“玄戒O1”背后的博弈:不是定制,是突圍
- 京東外賣“百億補(bǔ)貼”規(guī)則再調(diào)整:商家承擔(dān)比例升至70%-80%
- 多彩小直屏 直出氛圍感 vivo S30系列正式發(fā)布
- 萬豪與美團(tuán)的合作,為酒店的轉(zhuǎn)型難題提供了新思路
- vivo S30系列發(fā)布:多彩配色+撞色中框,國補(bǔ)價(jià)2294.15元起
- vivo S30系列大膽求變,玩出新格調(diào),拍出氛圍感
- 國補(bǔ)后2294.15元起!vivo S30系列新機(jī)發(fā)布,綜合體驗(yàn)全面升級
- 家裝「黑馬」住范兒的啟示
- 關(guān)稅產(chǎn)生影響,印度輸美的iPhone已是中國三倍多
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。