從過去到現(xiàn)在,人們一直在追求更?的算?。
近些年,隨著現(xiàn)代數(shù)據(jù)計算量和場景復雜度的不斷提升,普通計算?具提供的算力遠不足以支撐?物制藥、?象預報、軍事研究、基礎科學研究等尖端領域的應用需求。
作為科技領域頂尖的計算力代表,?性能計算(簡稱 HPC)系統(tǒng)運行速度通常比最快的商用臺式機、筆記本電腦或服務器系統(tǒng)快一百萬倍以上,可以通過并行工作的強大處理器集群處理海量大數(shù)據(jù),以極高的速度解決一些程序規(guī)模龐大、運算時間長以及數(shù)據(jù)量大的計算任務,逐漸成為企業(yè)、研究機構科技水平的重要指標。
作為科學研究前沿陣地和人才培養(yǎng)重地的高校,科研、教學、管理對HPC資源的需求也日益攀升。風口之下,如何評估?校算?服務現(xiàn)狀?如何高質(zhì)量推動算?平臺建設?如何讓?性能算?普惠師????成為當今教育界的“時代之問”。
要找到問題的答案,不妨關注一下國內(nèi)高校算?建設的標桿性案例。
浙江大學:打造算力革命“超強大腦”
2023年10月,教育部等六部門聯(lián)合發(fā)布《算力基礎設施高質(zhì)量發(fā)展行動計劃》,鼓勵各類高等院校、職業(yè)院校積極運用算力平臺為學校實習實驗實訓環(huán)境、平臺和基地建設、轉型發(fā)展及重大項目或課題的開發(fā)與創(chuàng)新提供支撐。
目前,清華大學、北京大學、上海交通大學、南京大學等高校都已建設自有的算力中心。從“基于經(jīng)驗”到“數(shù)據(jù)驅(qū)動”教學科研的數(shù)字化時代,HPC中心儼然成為眾多一流大學的標配。
作為海內(nèi)外均享有較高聲譽的綜合型、研究型高等學府,浙江大學(下稱“浙大”)這所百年名校不僅在多個學科領域遙遙領先,更著眼于科技賦能,加快算力中心建設,在計算領域的研究和打造智慧校園的路上走在全國前列。
在今天的浙大校園里,智能教學環(huán)境、信息化校園應用管理、用科學計算進行虛擬仿真實驗、訓練AI模型都已司空見慣,這些應用場景背后都少不了高性能算力的支撐。
此前,浙大HPC集群為數(shù)十個中小型集群,各學院自行采購搭建小型計算平臺,存在部分服務器裸硬件沒有集群化,算力資源分散管理、忙閑不均、共享不暢等問題。由于缺乏校級平臺統(tǒng)一管理全校計算資源,浙大在進行項目研究時,很難一次性調(diào)用大批量資源執(zhí)行計算,可能就會導致科研成果產(chǎn)出效率“慢別人一拍”,長此以往將不利于學校提升科研水平。
此外,許多科研項?在進??度復雜的模擬和計算時,既需要超算算?,?需要智算算?。長遠來看,推動“超算+智算”融合發(fā)展勢在必行。
為了進一步滿足科研工作和智慧校園的發(fā)展需求,浙大計劃建設一套高效、安全、可靠的智算超算專屬云平臺,進一步推進5G、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等新一代信息技術在教育領域的實際應用。
近期,浙大與中國移動在北京簽署戰(zhàn)略合作協(xié)議,在共建校園網(wǎng)絡、共創(chuàng)5G技術、共筑開放實驗室等合作基礎上,雙方還聯(lián)合打造了全國首個校企合營模式算力中心——中國移動-浙江大學啟真算力中心。
中國移動與浙江大學戰(zhàn)略合作簽約儀式
基于移動云技術底座,打造智算超算統(tǒng)一調(diào)度平臺,高效整合高性能CPU、GPU以及國產(chǎn)AI芯片等硬件資源,為浙大提供面向科學研究的AI+HPC算力服務。
同時,通過九天人工智能平臺開放,基于1600Gbps帶寬的高速網(wǎng)絡,浙大管理平臺軟硬件系統(tǒng)實現(xiàn)對通用、超算、智算等算力的統(tǒng)一管理、調(diào)度,以及數(shù)據(jù)模型訓練到模型推理、驗證的無縫銜接,滿足各學科領域?qū)τ诖笠?guī)模數(shù)據(jù)處理和科學計算的需求。
據(jù)統(tǒng)計,項目整體建成后,浙大人工智能算力將達711Pflops(每秒71.1億億次浮點運算能力水平),達到全國高校頭部水平。后續(xù),浙大還將接入中國移動“百川”算力并網(wǎng)平臺,實現(xiàn)全校算力資源的統(tǒng)一調(diào)度和算力服務普及、普惠,讓算力服務充分支撐教學和科研。
“智算一朵云”夯實科研創(chuàng)新數(shù)字基座
目前,高校的HPC平臺,包括軟硬件部分,基本是和國內(nèi)廠商合作共建完成的,有經(jīng)驗的云服務商,能幫助學校有效降低建設成本、減少資源浪費、提高科研效能等。
移動云作為HPC建設的早期參與者,面對國內(nèi)高校在人工智能教學、科研、實訓等環(huán)境搭建過程中普遍面臨的硬件使用成本高、模型部署困難、訓練數(shù)據(jù)難獲取、Deadline算力資源不足等痛點,已迭代出了系統(tǒng)完善、安全可靠的高校超算智算云解決方案——通過統(tǒng)一云管平臺、HPC集群管理調(diào)度系統(tǒng)、AI智算平臺,全方位支撐高校管理平臺軟硬件系統(tǒng),成為科研創(chuàng)新的底座。
在服務保障上,移動云為高校提供屬地化的服務模式,除了前期的規(guī)劃建設和運營,算力中心建設后,還會提供“遠程+駐場運維”的專人專職維護來保障業(yè)務系統(tǒng)的持續(xù)穩(wěn)定,讓高校客戶能夠?qū)W⒂跇I(yè)務、專注科研。目前,這一解決方案已在諸多高校中落地應用,為學校的高質(zhì)量發(fā)展注入新動能。
高效易用的調(diào)度管理平臺
可以肯定的是,中國高校“卷”高性能計算平臺的熱潮還將繼續(xù),隨著教育?業(yè)數(shù)字化發(fā)展進程不斷演進,高性能算力基礎設施的建設、算力供給能力的提升、算力普惠力度的加大,已成必然之勢。
基于多年的經(jīng)驗沉淀,移動云已構成全棧自主可控、行業(yè)領先的智算中心架構,形成了“N+X”智算資源布局體系,實現(xiàn)多種能力輸出,滿足生命科學、材料設計、氣象預測、計算物理等各類科研業(yè)務場景在云上的數(shù)據(jù)開發(fā)、存儲以及模型訓練和推理需求。
除此之外,移動云正逐步加強智算基礎設施建設,打造全棧智算產(chǎn)品體系。通過提供高性能智算集群、裸金屬、GPU云主機等 IaaS層基礎設施,移動云打造了具有特色的PaaS服務和模型即服務(MaaS)能力,同時依托九天智算平臺能力釋放澎湃智算算力,深入融合行業(yè)解決方法,探索大模型落地,實現(xiàn)已有服務規(guī)?;涞?。
面向未來,算力平臺作為“數(shù)字新基建”,在高校將發(fā)揮越來越大的作用,因此高校算力建設的持續(xù)投入很關鍵。除了學科科研之外,高校還需要更多地探索、發(fā)展計算技術,推動算力建設和數(shù)字能力的持續(xù)發(fā)展,以便更好地服務于自身的數(shù)字化轉型。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )