亚洲加勒比综合网,2023国产成人精品国产

5月20日消息（九九）5月17日，2025世界電信和信息社會日“智算產(chǎn)業(yè)創(chuàng)新發(fā)展論壇”在南昌舉辦，華為昇騰計算業(yè)務副總裁王慶文在演講中指出，大模型的性能在很多方面已經(jīng)可以與人類媲美，并且在快速收斂，從原來的千模百態(tài)收斂到十來家，隨著推理成本的大幅下降開始在很多行業(yè)獲得應用，為醫(yī)療診斷、工業(yè)質(zhì)檢、AI教學等方面帶來卓有成效的提升。

Gartner預測，未來兩年80%中國企業(yè)將部署生成式AI，60%會將AI融入產(chǎn)品服務，標志著企業(yè)AI應用從通用場景向核心生產(chǎn)場景滲透的“奇點時刻”到來，企業(yè)AI部署已進入全面深化階段。

王慶文進一步指出，運營商憑借領(lǐng)先的泛在多級訓推資源，既能滿足中小企業(yè)的靈活需求，也能支撐大型企業(yè)核心業(yè)務及海量用戶場景，并通過多租戶部署技術(shù)，保障大租戶資源獨立、中小租戶性能提升的同時全方位確保數(shù)據(jù)安全。

王慶文介紹，昇騰從基礎(chǔ)硬件、算子到推理系統(tǒng)全面創(chuàng)新，面向不同的推理場景需求，為包含運營商在內(nèi)的客戶及伙伴提供集高性能、高可靠、易部署、開源開放于一體的推理解決方案。

面向大型企業(yè)、C端超級應用等需要大規(guī)模推理算力資源的場景，高并發(fā)、低時延下的吞吐性能是關(guān)鍵。昇騰國內(nèi)首創(chuàng)大規(guī)模專家并行集群推理方案：通過將MoE模型的多專家權(quán)重數(shù)據(jù) 分散部署到更多的卡上，降低單卡權(quán)重加載時延，讓模型解碼輸出更快；單卡內(nèi)存容量占用的降低，也能夠支持更大用戶并發(fā)所需的KV緩存，實現(xiàn)系統(tǒng)的更大吞吐性能，平均單卡吞吐性能提升3倍以上，大幅降低每Token推理成本，幫助運營商構(gòu)筑高性能的AI算力基礎(chǔ)設(shè)施，為行業(yè)客戶帶來更優(yōu)的業(yè)務體驗。

面向中小企業(yè)、學校和醫(yī)院等機構(gòu)需要快速部署、快速落地AI應用的需求，昇騰使能運營商打造大模型應用一體機。打包量化、調(diào)優(yōu)等工具鏈顯著提升50%部署效率，通過MLA（Multi-Head Latent Attention）親和等特性，提升吞吐性能90%，從模型部署到應用上線實現(xiàn)“即開即用”，降低AI部署門檻，幫助運營商賦能千行萬業(yè)智能化轉(zhuǎn)型。目前已有超140家合作伙伴基于昇騰發(fā)布大模型應用一體機產(chǎn)品，為各行業(yè)場景提供廣泛的智能應用。

演講的最后，王慶文表示，昇騰將致力于打造堅實的算力底座，攜手運營商及ISV等產(chǎn)業(yè)伙伴破解算力供給與場景落地的關(guān)鍵挑戰(zhàn)，加速AI在千行萬業(yè)的落地應用，為產(chǎn)業(yè)融合升級注入強勁動能。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

華為王慶文：打造堅實算力底座，加速AI賦能千行萬業(yè)

下一篇

華為王慶文：打造堅實算力底座，加速AI賦能千行萬業(yè)

下一篇

華為王慶文：打造堅實算力底座，加速AI賦能千行萬業(yè)