谷歌發(fā)布革命性 Gemma 3n 端側(cè)多模態(tài)模型:小內(nèi)存也能輕松駕馭 AI,開啟全新智能時代!
在近日舉行的 2025 年 I/O 開發(fā)者大會上,谷歌推出了一款名為 GEMMA 3n 的端側(cè)多模態(tài) AI 模型,這款模型可以在手機、平板和筆記本電腦等設(shè)備上本地運行,處理音頻、文本、圖片和視頻等多種數(shù)據(jù)類型。這一創(chuàng)新性舉措無疑將為 AI 在移動設(shè)備領(lǐng)域的應(yīng)用開啟全新的篇章。
首先,讓我們來了解一下 GEMMA 3n 的技術(shù)特點。據(jù) Gemma 產(chǎn)品經(jīng)理 Gus Martins 透露,Gemma 3n 采用了一種與 Gemini Nano 同款架構(gòu),但性能表現(xiàn)更為出色。這款模型可以在內(nèi)存小于 2GB 的設(shè)備上運行,這無疑是一個巨大的突破。同時,Gemma 3n 還采用了谷歌 DeepMind 開發(fā)的 Per-Layer Embeddings(PLE)技術(shù),這一技術(shù)顯著降低了模型的內(nèi)存需求,使得這款模型在有限的內(nèi)存條件下也能表現(xiàn)出色。
除了技術(shù)上的突破,Gemma 3n 在性能方面也有顯著的提升。通過 PLE、KVC 共享和高級激活量化等技術(shù),Gemma 3n 在移動設(shè)備上的響應(yīng)速度提升了一倍以上,這無疑將大大提升用戶的使用體驗。此外,Gemma 3n 的質(zhì)量也優(yōu)于 Gemma 3 4B 版本,這進一步證明了谷歌在 AI 技術(shù)方面的領(lǐng)先地位。
值得一提的是,Gemma 3n 在非英語語言處理上也有了突破。該模型在日語、德語、韓語、西班牙語和法語等語言中的表現(xiàn)尤為出色。在多語言基準(zhǔn)測試 WMT24++ 中,Gemma 3n 的得分高達 50.1%,這一成績令人矚目。這意味著 GEMMA 3n 有望在跨語言翻譯、語音識別等領(lǐng)域發(fā)揮重要作用。
那么,如何使用 GEMMA 3n 呢?目前,用戶無需任何設(shè)置,只需通過 Google AI Studio 直接在瀏覽器中使用即可。而對于開發(fā)者而言,他們可以通過 Google AI Edge 集成本地功能,支持文本和圖像理解與生成,未來還將擴展更多能力。這一開放的接入方式無疑將吸引更多的開發(fā)者參與到 GEMMA 3n 的開發(fā)與應(yīng)用中來。
GEMMA 3n 的發(fā)布無疑將為移動設(shè)備領(lǐng)域的 AI 應(yīng)用帶來革命性的變化。在內(nèi)存有限的條件下,小內(nèi)存也能輕松駕馭 AI,這無疑將為更多的用戶提供更為便捷、高效的 AI 服務(wù)。此外,GEMMA 3n 在非英語語言處理方面的突破也將為全球范圍內(nèi)的語言服務(wù)帶來革新。
總的來說,GEMMA 3n 的發(fā)布是谷歌在 AI 技術(shù)領(lǐng)域的一次重大突破,也是谷歌致力于推動 AI 技術(shù)在各個領(lǐng)域應(yīng)用的體現(xiàn)。隨著 GEMMA 3n 的廣泛應(yīng)用和普及,我們有望進入一個全新的智能時代。在這個時代里,AI 將無處不在,為我們的生活帶來更多的便利和可能。我們期待著 GEMMA 3n 在未來能夠帶來更多的驚喜和突破。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )