極客網·極客觀察8月9日 2022年7月29日,首屆中國算力大會在山東濟南拉開帷幕。這是全國首個以數據中心算力賦能為主題的省部聯辦會議,會上重磅發(fā)布了我國首個算力產業(yè)發(fā)展指數、《算力白皮書》《算力設施產業(yè)圖譜》等系列成果,規(guī)格高、參與廣、內容實、成果豐,引發(fā)了社會各界的廣泛關注。
會上,由中國電子技術標準化研究院聯合華為技術有限公司及鵬城實驗室、北京航空航天大學、中國移動、中國電信、中國聯通、武漢人工智能計算中心、西安未來人工智能計算中心等單位編寫的《計算中心有效算力評測體系白皮書》正式發(fā)布。白皮書首次定義了計算中心有效算力的概念和內涵,給出了有效算力的評測指標和評測方法,以及有效算力和有效算力評測指標體系的應用場景、標準進展與下一步規(guī)劃等,為計算中心新基建高質量建設指明了方向,尤其引人注目。
在今天的數字世界里,相信大家對算力的魔力已經不陌生。智能手機里的APP越來越懂你的愛好習性,電商平臺的客服機器人幾乎能夠回答你的所有問題,工廠里的智能機器人能夠從事越來越多的生產作業(yè),馬路上穿梭的車輛中偶爾會出現一輛“無人駕駛”的出租車……背后都離不開算力的支持。
那么時至今日,業(yè)界為什么要提出有效算力,并致力于構建有效算力評測體系?它是如何評測的,相比傳統(tǒng)評測方式有何獨特價值?這一舉措對當前我國推動人工智能計算中心等算力基礎設施建設有何意義?讓我們一探究竟。
高效計算中心建設成為必答題,算力評測體系升級勢在必行
數字經濟時代,算力已成為生產力,重大科研突破與產業(yè)發(fā)展都需要大算力的支撐,這對計算中心新基建的發(fā)展提出了更高的要求。近年來,以人工智能計算中心為代表的算力基礎設施成為各地建設熱點,國家總體布局設計“東數西算”,更是要將包括人工智能計算中心、一體化大數據中心、超算中心在內的計算中心聯接起來,組成全國一體化算力網絡,全面支撐數字經濟高質量發(fā)展。
與此同時,計算中心的高速增長也帶來了一系列能源消耗問題,使得計算中心發(fā)展站在了實現國家“雙碳”目標的第一線,這要求各地在設計建設計算中心時,不僅要關注市場所需的算力場景和算力總量,還得重視相應的能耗和碳排。這對算力的效率提出了更高要求,高效計算中心建設成為必答題。只有通過節(jié)能、增效兩手抓應對能耗,才能建設高質量的計算中心,提升算力質量。
質量提升,標準先行。要建設高質量計算中心,提升算力質量,首當其沖的就是需要構建合適的算力評測體系。
這些年來,從最基本的能源使用效率PUE(Power?Usage?Effectiveness)、芯片標稱的規(guī)格算力,到SPEC關注單機或單服務器的單臺設備性能評價,IO500重點呈現的系統(tǒng)整體存儲方面的性能,再到通過真實應用完整呈現整系統(tǒng)能力的AIbench和MLperf等,算力評價指標正逐步從單點、部件能力評測過渡到場景化、全棧全場景業(yè)務生產力評價?!队嬎阒行挠行懔υu測體系白皮書》提出的計算中心有效算力,正是要通過評測真實業(yè)務性能表現,來衡量算力基礎設施對業(yè)務的支撐效果,也就是業(yè)務實際可獲得的算力水平。相比規(guī)格算力更偏向于統(tǒng)計意義上算力的數量,有效算力更強調算力的質量。
相應地,計算中心有效算力評測體系確立了一個規(guī)范有效算力如何進行計量的指標體系,其包含了方法、工具和數據集等。該評測體系的核心是有效算力指標(CUE:Computing Usage Effectiveness),用以表示有效算力的量化數據。CUE公式的設立,可以有效避免多個真實業(yè)務性能測試所帶來的單位不統(tǒng)一、描述過于復雜等局面,通過幾何加權平均的方式獲得一個單一數值,有助于進行定量、對比性分析。
有效算力評測率先落地人工智能領域,全棧垂直優(yōu)化價值凸顯
從白皮書披露的情況看,計算中心有效算力評測方法與評測體系的標準化已經率先落地人工智能領域。這不難理解,因為據權威機構預測,隨著視頻、圖片等更多需要AI技術來處理的非機構化數據的大量涌現,未來10年通用算力將增長10倍,而人工智能算力將增長500倍,算力的增量將主要是AI算力。
2021年8月26日,由中國電子技術標準化研究院牽頭起草,中國科學院軟件研究所、北京航空航天大學、華為技術有限公司等共同研制的T/CESA 1169—2021《信息技術人工智能服務器系統(tǒng)性能測試規(guī)范》發(fā)布,并于同年9月1日起實施。該標準提出了有效算力指標公式,制定了面向人工智能計算中心的有效算力測試集,并給出了人工智能領域的有效算力測試方法,展現了CUE測試的獨特價值。
在人工智能領域,實際吞吐率代表人工智能服務器系統(tǒng)對特定訓練或推理作業(yè)的有效計算能力。提升有效計算能力可達到硬件系統(tǒng)擴容的效果。有效算力的提升,軟件方面的優(yōu)化可包含如計算設備加速庫中算子的優(yōu)化、軟件棧的輕量化等技術的應用。比如對特定訓練作業(yè)的有效計算能力,是單位時間內訓練過程能消耗的樣本數量(視覺類測試是圖片數每秒、自然語言處理類測試是句數每秒)。評價人工智能服務器系統(tǒng)的綜合訓練能力,可將多個代表性訓練作業(yè)的有效計算能力綜合起來,形成整系統(tǒng)的有效計算能力,即根據上述公式,計算整系統(tǒng)在給定任務集合S上,實際吞吐率與每任務基線吞吐率之比的加權幾何平均。
從中可見,在一定規(guī)模規(guī)格算力集群系統(tǒng)上進行有效算力測試,通過優(yōu)化硬件配置、基礎軟件版本以及應用參數等,可以實現全棧優(yōu)化的效果,并根據實測工具獲得最終性能數值。這樣的數值可以作為不同技術路線集群系統(tǒng)的性能對比,以牽引技術架構與軟硬件設計的演進。
換句話說,有效算力評測體現的是全棧垂直優(yōu)化的價值,可真實反映計算中心資源使用情況,通過效能分析,指導計算中心面向業(yè)務場景,從全棧融合的角度——自機房、能源基礎設施、硬件基礎設施至軟件基礎設施各層的整體設計與建設,提高計算中心資源使用率。
有效算力推動算力基礎設施建設,人工智能計算中心建設提速
很顯然,這樣的評測指標和方法立足真實業(yè)務應用性能,覆蓋了計算中心全生命周期,可用于評價計算中心建設的綠色性、先進性、實用性。各地的建設主體可按照有效算力標準對計算中心進行系統(tǒng)化設計,牽引軟硬件的深度協同,從全棧優(yōu)化中獲取更優(yōu)的有效算力,實現從能耗比到算能比的演進,提升資源可分配的效能。
當前,在數字經濟高質量發(fā)展、“東數西算”、“雙碳”目標等國策的綜合牽引下,全國各地的人工智能計算中心、一體化大數據中心、超算中心等算力基礎設施建設正如火如荼。在這些大并行/并發(fā)集群系統(tǒng)特征更為明顯的業(yè)務場景,有效算力評測體系整系統(tǒng)評測、全棧垂直優(yōu)化的理念和方法將最能夠更好地推動算力基礎設施建設。
資料顯示,華為等業(yè)界伙伴也已基于該體系在計算中心的項目建設中取得顯著成效。早在2021年9月,面向人工智能計算中心、高性能計算中心,和一體化大數據中心等多種場景,華為已經推出集群計算解決方案,通過系統(tǒng)工程與架構創(chuàng)新,實現從能源效率指標PUE最佳到有效算力指標CUE最佳的跨越。目前,該集群計算解決方案已用于武漢、西安、中原、成都、南京、杭州等各地的人工智能計算中心項目。
在先行者的帶動之下,全國20多個城市已陸續(xù)啟動或規(guī)劃了人工智能計算中心的建設。就在本屆中國算力大會期間,華為透露今年5月開建的青島人工智能計算中心項目預計將于9月上線投運,同時還在積極配合濟南人工智能計算中心的建設。這些已上線或即將上線的人工智能計算中心,大部分已經或將要接入中國算力網絡,推動全國算力一張網的整體布局。
細究這些人工智能計算中心快速建設上線并高效運行的背后,可以發(fā)現它們均以昇騰AI基礎軟硬件平臺為基礎,并引入CUE指標做了全棧設計與優(yōu)化,讓“計算中心作為一臺計算機”高效運轉,在支持AI、HPC、大數據等多種算力場景的同時,實現了各類算力的高效利用,大幅提升了有效算力。
寫在最后:
有預測指出,算力指數每提高1%,國家的數字經濟和GDP將分別增長3.5‰和1.8‰。工信部數據顯示,2021年底我國算力核心產業(yè)規(guī)模達1.5萬億元,位居全球第二,近五年平均增速超過30%,帶動關聯產業(yè)規(guī)模超過8萬億元。很顯然,提供算力生產力的計算中心,將成為現代科技與產業(yè)發(fā)展的加速器,數字化社會必備的基礎設施。
當算力逐步成為經濟社會的基礎設施,其價值不僅在“量”,更需要“質”,正如《計算中心有效算力評測體系白皮書》所述——將以有效算力為衡量方式牽引計算中心新型基礎設施高質量建設,達到以業(yè)務應用為牽引、以全棧優(yōu)化為手段、以節(jié)能增效為目標的計算中心建設,提升計算中心新型基礎設施建設的質量,支撐數字經濟等宏觀政策與頂層設計落地。
- 5G-A,聯通用AI幫你這么玩兒
- 共建AI時代全球化開發(fā)者生態(tài),華為云持續(xù)加碼海外布局
- 直擊2025 MWC上海:5G-A加速跑,AItoX落地忙
- 行業(yè)熱議“芯片問題沒必要擔心”,背后的AI創(chuàng)新范式已變
- 28歲華裔創(chuàng)建Scale AI,憑什么拿到Meta天價投資?
- 昇騰CANN再進化:開放創(chuàng)新繁榮AI生態(tài)
- 報告稱83%的Z世代愿與AI結婚 專家警告本質上屬于"行為上癮"
- 鯤鵬向“智”,“轅”啟未來
- 人形機器人格斗首秀背后:一場生態(tài)體系的中美較量
- 開放創(chuàng)新托舉產業(yè)生態(tài),昇騰AI持續(xù)升騰
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。