在AI技術(shù)重塑全球產(chǎn)業(yè)格局的進程中,計算范式正經(jīng)歷從運算器為中心到存儲器為中心的范式躍遷。這一變革重新定義了“先進存力”的邊界。
得一微電子首次創(chuàng)造性地提出“AI存力芯片”的技術(shù)概念。未來 AI 系統(tǒng)的每個單元都將智能體化。AI 存力芯片致力于將先進存力的 AI 智能體用芯片實現(xiàn),并主動為 AI 系統(tǒng)的GPU/NPU提供有價值的計算卸載和數(shù)據(jù)洞察。這一創(chuàng)新成果將大大提升整個系統(tǒng)的運行效率和智能化水平。
從存儲到存力,技術(shù)路徑的跨越式升級
作為國內(nèi)少數(shù)具備完整存儲控制芯片自主研發(fā)能力的企業(yè),得一微正迎來其發(fā)展歷程中的“高光時刻”:一方面,公司的存儲控制芯片產(chǎn)品順利導(dǎo)入手機頭部廠商,PCIe SSD主控產(chǎn)品線持續(xù)突破;另一方面,得一微在工規(guī)和車規(guī)存儲市場取得重要突破。尤其是在車規(guī)產(chǎn)品方面,公司更是連續(xù)多年實現(xiàn)了翻倍式增長,這進一步鞏固了公司的實力。
在AI席卷全球的當(dāng)下,得一微與時俱進,啟動開拓AI存力芯片的戰(zhàn)略升級。
“在過去的計算范式中,存儲只是圍繞著 CPU,為其提供服務(wù),存儲的數(shù)據(jù)也僅僅是數(shù)據(jù)。但進入AI時代,存儲的核心數(shù)據(jù)變成了大模型的參數(shù),神經(jīng)網(wǎng)絡(luò)的權(quán)重,還有向量化的知識。與此同時,GPU也取代CPU,成為了存儲的新‘大哥’”,得一微電子市場總監(jiān)羅挺在此前的CFMS|MemoryS 2025 現(xiàn)場告訴半導(dǎo)體行業(yè)觀察。
伴隨著這種情況的產(chǎn)生,對系統(tǒng)的理解變了,存儲及其在系統(tǒng)中扮演的角色也變了。
如羅挺所說,當(dāng)前,AI無論是存儲和推理都用到了很多的GPU,GPU逐漸顯現(xiàn)出算力主導(dǎo)地位。在GPU的指導(dǎo)下,數(shù)據(jù)按照需求在系統(tǒng)中高速運轉(zhuǎn)。但在這個過程中,系統(tǒng)開始出現(xiàn)了諸多問題。例如,HBM成為了成本和性能的瓶頸,SSD/UFS的設(shè)計依然是以CPU為中心,這都是AI系統(tǒng)的方案供應(yīng)商和供應(yīng)鏈需要著重解決的關(guān)鍵問題。
作為一家以芯片創(chuàng)新和解決方案聞名的供應(yīng)商,得一微對此也有了自己的思考。
“在AI快速發(fā)展的時代,我們需要調(diào)整整個產(chǎn)品的思路。”羅挺表示。他以Transformer架構(gòu)的LLM舉例說道,當(dāng)前,無論是Prefill和Decode,注意力還是KV Cache, 向量數(shù)據(jù)庫還是知識圖譜的訪問,都是在GPU上運行。然而,這種高度集中的計算方式很快遇到了帶寬的瓶頸。
“在得一微看來,以存算一體為核心的存力芯片,將改變神經(jīng)網(wǎng)絡(luò)的計算方式,AI存力芯片才是未來。”羅挺說。
AI-MemoryX,是AI存力芯片的探索
得一微此前發(fā)布的AI-MemoryX顯存擴展卡,就是得一微針對新型需求的成功嘗試。
該方案通過創(chuàng)新架構(gòu),將單機顯存容量從傳統(tǒng)顯卡的幾十GB提升至10TB級別,僅需1到16張顯卡,即可支持32B至671B等超大模型的微調(diào)訓(xùn)練,大幅降低對GPU的數(shù)量需求,突破大模型訓(xùn)練的顯存瓶頸。
“AI-MemoryX不僅是一張擴展卡,更是一套完整的微調(diào)訓(xùn)練機解決方案。”羅挺強調(diào)。該技術(shù)涵蓋大模型訓(xùn)練框架、顯存擴展卡軟件棧以及顯存擴展卡X200系列,為大模型微調(diào)訓(xùn)練提供全方位的技術(shù)支持與賦能。目前,該方案已成功應(yīng)用于DeepSeek等大模型的訓(xùn)練優(yōu)化,協(xié)助開發(fā)者發(fā)掘微調(diào)的潛力和價值,推動AI技術(shù)在各行業(yè)的快速落地。
隨著AI-MemoryX技術(shù)的迭代創(chuàng)新,得一微將在各個應(yīng)用場景推出AI存力芯片和解決方案。
AI存力芯片,重構(gòu)計算范式
也許很多讀者會和筆者一樣,對于以前專注于存儲的得一微,為何能夠迅速轉(zhuǎn)向這些看來與計算有著更多關(guān)系的產(chǎn)品。
針對這個問題,羅挺表示,公司做的產(chǎn)品創(chuàng)新和產(chǎn)品線拓展,主要還是圍繞著存儲(存儲控制,存算一體,存算互聯(lián))展開。在公司過去打造這些產(chǎn)品的過程中,長年積累的硬件、軟件、算法和SoC等方面的經(jīng)驗和人才,這也是公司能構(gòu)建AI存力芯片新技術(shù)路徑的底氣。
展望未來的發(fā)展,羅挺表示,公司會堅持三步走戰(zhàn)略:第一,利用現(xiàn)有的芯片和軟件,打造出能快速創(chuàng)造價值的AI存力解決方案;第二,把軟件的創(chuàng)新放到芯片里面固化,將算法創(chuàng)新轉(zhuǎn)化為芯片能力;第三,推動AI存力芯片的應(yīng)用和生態(tài)建設(shè)。
過去幾年,國內(nèi)芯片行業(yè)最大的狀態(tài)就是內(nèi)卷,眾多廠商圍繞著類似的產(chǎn)品定義展開激烈的競爭,除了精益求精,如何尋找方向?得一微通過AI存力芯片的創(chuàng)新,開辟了新的技術(shù)賽道,更為中國存儲產(chǎn)業(yè)的升級發(fā)展提供了示范。未來,隨著AI存力需求的持續(xù)增長,存力將從被動支撐算力到主動驅(qū)動算力,得一微的“AI存力芯片”,讓每比特數(shù)據(jù)創(chuàng)造更多智能。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )