6月14日消息,近日智源研究院在北京智源大會上重磅發(fā)布了全面開源的“悟道3.0”系列大模型,包括“悟道·天鷹”(Aquila)語言大模型等領先成果。目前,摩爾線程已率先完成對“悟道·天鷹”(Aquila)大模型的推理兼容適配,整個適配過程僅花費不到6小時時間,便實現(xiàn)與摩爾線程自研MUSAChat應用的無縫集成。此前,摩爾線程曾在ChatGLM發(fā)布后24小時內(nèi)實現(xiàn)適配,并在數(shù)小時內(nèi)適配LLaMA模型,摩爾線程CUDA兼容的技術能力一再被驗證。
這充分得益于摩爾線程強大的代碼移植工具"MUSIFY"。該工具可快速將現(xiàn)有的CUDA程序遷移至摩爾線程MUSA,零成本完成CUDA代碼自動移植,之后用戶短時間內(nèi)即可完成熱點分析和針對性優(yōu)化,大大縮短遷移優(yōu)化的周期,從而使得大模型適配形成了標準“流水線作業(yè)”,讓開發(fā)者可以省時、省力、省事、省心。
目前,基于摩爾線程打造的AI與云計算平臺,已經(jīng)可以運行ChatGLM、Stable Diffusion、LLaMA、“悟道3.0”等開源大模型,以及摩爾線程自研的MUSAChat和MUSABert等模型的部分訓練和推理應用。借助摩爾線程元計算統(tǒng)一系統(tǒng)架構(gòu)MUSA,用戶可以復用PyTorch開源社區(qū)的大量模型算子,降低開發(fā)成本。與此同時,摩爾線程開源的MT Pytorch可以支持多種模型的推理,覆蓋CV、NLP、語音等多個領域,能夠運行典型的大模型分布式多卡推理,也可以支持單機多卡與多機多卡的分布式訓練。利用數(shù)據(jù)并行、模型并行以及ZERO等分布式訓練技術,MT PyTorch還可以完成簡單基礎模型以及典型Transformer結(jié)構(gòu)的NLP語言模型的訓練。
據(jù)悉,智源此次發(fā)布的“悟道3.0”系列開源模型涵蓋語言、視覺、多模態(tài)等基礎大模型,其中,“悟道·天鷹”(Aquila)語言大模型是首個具備中英雙語知識、支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。其在中英文高質(zhì)量語料基礎上從0開始訓練,通過數(shù)據(jù)質(zhì)量的控制、多種訓練的優(yōu)化方法,實現(xiàn)在更小的數(shù)據(jù)集、更短的訓練時間內(nèi),獲得比其他開源模型更優(yōu)的性能。
“悟道?天鷹(Aquila)”語言大模型開源商用許可無疑將會成為自主大語言模型產(chǎn)業(yè)生態(tài)的一個里程碑事件。摩爾線程也愿與眾多優(yōu)秀的基礎模型供應商深度合作,攜手從硬件、算子、算法多個方面進行深度優(yōu)化,從硬件、軟件、模型、業(yè)務多個維度賦能應用開發(fā)商,致力于讓大模型更好賦能千行百業(yè)。
- 微信警告不要使用第三方工具管理聊天記錄 會帶來三大風險
- 2025五一檔新片總票房破億 《水餃皇后》持續(xù)領跑
- 快手調(diào)整組織架構(gòu):成立可靈AI事業(yè)部 蓋坤任負責人
- 報告:抖音月活用戶破10億 人均每天刷抖音超1.5小時
- 從家庭連接到智能共生:中興通訊首推AI家庭“四大件”
- 紫光國微2025年Q1凈利潤1.19億元,同比下降61.11%
- 尚網(wǎng)網(wǎng)絡與南京公交集團達成戰(zhàn)略合作 共建智慧出行新生態(tài)
- 華為發(fā)布AI數(shù)據(jù)湖解決方案,加速行業(yè)智能化
- 淘寶宣布加入外賣大戰(zhàn),“小時達”升級為“閃購” 5月6日全國鋪開
- 中國電信柯瑞文:全面深入實施云改數(shù)轉(zhuǎn)戰(zhàn)略 把握人工智能發(fā)展趨勢
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。