震撼!這家公司僅用19天時間就完成百億級參數大模型全量訓練

6月10日上午,北京智源大會現場AI系統(tǒng)分論壇上,天數智芯產品總監(jiān)宋煜發(fā)表了《國產GPU助力大模型的實踐》的演講,講述這家率先完成通用GPU量產的企業(yè)此次的新動作。

天數智芯的天垓、智鎧系列通用GPU產品具有高性能、廣通用、開發(fā)成本低的特點,廣泛支持DeepSpeed、Colossal、BM Train等各種大模型框架,基于天垓、智鎧加速卡的算力集群方案不僅能夠有效支持LLaMa、GPT-2、CPM、GLM等主流AIGC大模型的Pretrain和Finetune,為行業(yè)伙伴提供一站式的大模型算力及賦能服務。同時面向大模型推理側的一體機,性價比超過國內現有市場主流產品。

據悉,僅用時19天時間,天數智芯就成功完成了北京智源人工智能研究院70億參數大模型全量訓練,收斂效果與英偉達A100集群相當。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )