從波士頓動(dòng)力的空翻機(jī)器人,到特斯拉Optimus機(jī)器人走進(jìn)汽車制造車間,再到北京機(jī)器人馬拉松比賽……具身智能這個(gè)高冷、硬核的專業(yè)術(shù)語(yǔ),近年來(lái)在全球范圍內(nèi)掀起新一輪技術(shù)革命浪潮。
作為人工智能、機(jī)器人學(xué)與認(rèn)知科學(xué)的交叉領(lǐng)域,具身智能的核心是通過(guò)物理實(shí)體與環(huán)境的動(dòng)態(tài)交互,實(shí)現(xiàn)“感知-決策-行動(dòng)”的閉環(huán),從而推動(dòng)智能體從虛擬認(rèn)知向?qū)嶓w操作的躍遷。如今,具身智能被視為人形機(jī)器人、工業(yè)自動(dòng)化及服務(wù)機(jī)器人領(lǐng)域的關(guān)鍵驅(qū)動(dòng)力,并正以前所未有的速度刷新著人們的認(rèn)知。
不過(guò),從技術(shù)創(chuàng)新到場(chǎng)景落地始終需要跨越巨大的鴻溝,尤其是人形機(jī)器人依然面臨著各色各樣的挑戰(zhàn)。那么,在具身智能、AI大模型快速發(fā)展的今天,人形機(jī)器人未來(lái)發(fā)展趨勢(shì)有哪些?當(dāng)下最重要的技術(shù)挑戰(zhàn)是什么?未來(lái)有哪些值得探索的落地場(chǎng)景?
<ph1 class="ql-align-justify"> 人形機(jī)器人當(dāng)下最迫切的挑戰(zhàn)是什么
2025年,被產(chǎn)業(yè)界視為人形機(jī)器人的量產(chǎn)元年、爆發(fā)元年。
事實(shí)的確如此。在政策驅(qū)動(dòng)和技術(shù)進(jìn)步等多重因素的驅(qū)動(dòng)下,全球人形機(jī)器人市場(chǎng)迎來(lái)爆發(fā)式增長(zhǎng)。根據(jù)高工機(jī)器人產(chǎn)業(yè)研究所(Gell)數(shù)據(jù)顯示,中國(guó)人形機(jī)器人2024年的出貨量達(dá)到2400臺(tái),到20230年則有望達(dá)到16.25W臺(tái),擁有著廣闊的市場(chǎng)前景。
當(dāng)前,以人形機(jī)器人為代表的具身智能產(chǎn)品已經(jīng)在制造業(yè)的部分場(chǎng)景中得到了快速落地與部署,例如像汽車裝配線、特種/惡劣環(huán)境等;另外,像醫(yī)療護(hù)理等場(chǎng)景未來(lái)也有著較強(qiáng)的需求,不過(guò)具身智能在醫(yī)療護(hù)理場(chǎng)景的技術(shù)成熟度有待進(jìn)一步提升;個(gè)人/家庭服務(wù)是人形機(jī)器人的最終形態(tài),未來(lái)市場(chǎng)潛力不可低估。
不過(guò),人形機(jī)器人距離真正大規(guī)模量產(chǎn)商用化依然有著一定的距離,在數(shù)據(jù)、硬件架構(gòu)、成本以及安全性等方面存在不少亟待解決的挑戰(zhàn)。英特爾中國(guó)邊緣計(jì)算事業(yè)部EIS高級(jí)總監(jiān)李巖直言:“以人形機(jī)器人為代表的具身智能行業(yè)發(fā)展迅速,但也存在系統(tǒng)架構(gòu)的非一致性、解決方案的泛化能力不足、場(chǎng)景適配的復(fù)雜性等問(wèn)題?!?/p>
這其中,當(dāng)前人形機(jī)器人主流采用的大小腦解決方案存在的瓶頸愈發(fā)明顯。所謂大小腦方案,即機(jī)器人需同時(shí)處理實(shí)時(shí)控制(“小腦”功能)與復(fù)雜決策(“大腦”功能),導(dǎo)致對(duì)異構(gòu)算力的需求激增。在很多現(xiàn)有方案中,“大小腦雙系統(tǒng)”不僅會(huì)帶來(lái)硬件成本的升高,而且通信延遲現(xiàn)象明顯,甚至可靠性、功耗等方面等挑戰(zhàn)也不容忽視。
例如,大小腦的方案從硬件層面上是分開(kāi)的,這使得多種傳感器融合變得很困難。英特爾中國(guó)網(wǎng)絡(luò)與邊緣技術(shù)與產(chǎn)品總監(jiān)王景佳介紹:“大小腦雙系統(tǒng)方案更多是產(chǎn)業(yè)之前發(fā)展階段的無(wú)奈之舉。這種架構(gòu)設(shè)計(jì)不可避免需要系統(tǒng)之間信息交互、同步,導(dǎo)致帶寬限制和通信延遲,還需要維護(hù)兩套系統(tǒng)?!?/p>
那么,是否有大小腦的替代方案,來(lái)助推人形機(jī)器人進(jìn)一步加速發(fā)展與壯大?對(duì)此,英特爾帶來(lái)了其具身智能大小腦融合方案。
<ph1 class="ql-align-justify"> 大小腦融合方案為何是趨勢(shì)
針對(duì)人形機(jī)器人的大小腦方案的種種挑戰(zhàn),英特爾提出“大小腦融合”的具身智能解決方案,其核心思路是通過(guò)異構(gòu)計(jì)算架構(gòu)與軟硬件協(xié)同優(yōu)化,降低系統(tǒng)復(fù)雜度與成本。
具體來(lái)看,英特爾的具身智能解決方案首先構(gòu)建起了一體化的計(jì)算平臺(tái),英特爾 酷睿Ultra處理器通過(guò)CPU 、集成的英特爾銳炫 GPU 與 NPU 協(xié)同運(yùn)行,以實(shí)現(xiàn)異構(gòu)計(jì)算的融合、高精度實(shí)時(shí)性能和靈活擴(kuò)展,且支持具身智能的多樣化負(fù)載穩(wěn)定運(yùn)行,大幅提升具身智能系統(tǒng)的整體效率和響應(yīng)能力。
“融合方案能夠使得人形機(jī)器人的感知、交互、任務(wù)規(guī)劃和運(yùn)動(dòng)控制在統(tǒng)一的系統(tǒng)中實(shí)現(xiàn)高效整合。”王景佳介紹道,“在英特爾SoC一體化計(jì)算平臺(tái)中,CPU可支持具身智能方案進(jìn)行復(fù)雜的運(yùn)動(dòng)控制,GPU用于具身智能處理環(huán)境感知、任務(wù)識(shí)別、任務(wù)規(guī)劃、大語(yǔ)言模型(LLM)、視覺(jué)語(yǔ)言模型(VLM)和端到端模型等復(fù)雜任務(wù),而NPU 則承載語(yǔ)音識(shí)別、實(shí)時(shí)視覺(jué)處理、傳感器數(shù)據(jù)分析等需長(zhǎng)時(shí)間運(yùn)行的 AI 任務(wù)?!?/p>
其次,人形機(jī)器人本身在在軟件層面也在高速進(jìn)化,除了傳統(tǒng)的運(yùn)動(dòng)軌跡規(guī)劃、全身步態(tài)控制、定位導(dǎo)航之外,也加入視覺(jué)感知、大語(yǔ)言模型和基于AI模仿學(xué)習(xí)的動(dòng)作模型等一系列算法與應(yīng)用。王景佳直言,這不僅僅需要異構(gòu)算力支撐,還需要在軟件層面進(jìn)行優(yōu)化,從而實(shí)現(xiàn)人形機(jī)器人整體性能和用戶體驗(yàn)的提升。
為此,英特爾提供具身智能軟件全站開(kāi)發(fā)套件,通過(guò)包括OpenVINO 工具套件、英特爾 oneAPI 工具包、Intel Extension for PyTorch-LLM(IPEX)、英特爾工業(yè)邊緣控制平臺(tái)(ECI)、基于開(kāi)源機(jī)器人操作系統(tǒng)的庫(kù)、中間件和示例應(yīng)用程序,使代碼實(shí)現(xiàn)一次開(kāi)發(fā)多平臺(tái)部署,縮短評(píng)估和開(kāi)發(fā)時(shí)間,加快客戶應(yīng)用程序的部署以及算法和應(yīng)用的運(yùn)行。此外,英特爾還提供跨平臺(tái) AI 模型優(yōu)化工具以及端到端流程加速方案,以簡(jiǎn)化方案搭建過(guò)程,加快產(chǎn)品上市。
“從長(zhǎng)遠(yuǎn)看,融合一定是人形機(jī)器人的趨勢(shì)。無(wú)論是大小腦的融合,還是內(nèi)置各種模型的融合。相比于其他方案,英特爾的具身智能融合方案從性能、成本、可靠性等綜合來(lái)看都是具有優(yōu)勢(shì)的?!?/p>
人形機(jī)器人未來(lái)如何行穩(wěn)致遠(yuǎn)
從短期內(nèi)來(lái)看,以人形機(jī)器人為代表的具身智能會(huì)聚焦落地場(chǎng)景的進(jìn)一步突破,通過(guò)英特爾大小腦融合方案來(lái)加速技術(shù)迭代與創(chuàng)新,逐步在更多應(yīng)用場(chǎng)景中探索落地;從長(zhǎng)期來(lái)看,人形機(jī)器人面臨著作業(yè)對(duì)象和場(chǎng)景多、感知模態(tài)和類別多、運(yùn)動(dòng)DOF和模式多等情況,未來(lái)依然面臨著交互行為學(xué)習(xí)訓(xùn)練數(shù)據(jù)匱乏、可泛化、自適應(yīng)、安全性等長(zhǎng)期挑戰(zhàn)。
如何才能讓人形機(jī)器人未來(lái)發(fā)展行穩(wěn)致遠(yuǎn)?
在王景佳看來(lái),開(kāi)放的生態(tài)有利于產(chǎn)學(xué)研用聯(lián)動(dòng)起來(lái),共同推動(dòng)整個(gè)產(chǎn)業(yè)鏈的協(xié)同創(chuàng)新。尤其是在中國(guó)市場(chǎng),人形機(jī)器人產(chǎn)業(yè)發(fā)展速度極為快速,更加需要一個(gè)良性、健康的生態(tài)為產(chǎn)業(yè)發(fā)展注入活力。
為此,英特爾攜手本地生態(tài)伙伴展開(kāi)深度合作,探索從技術(shù)研發(fā)到場(chǎng)景落地的全鏈路協(xié)同模式,構(gòu)建起協(xié)同共進(jìn)的產(chǎn)業(yè)生態(tài)格局,為行業(yè)發(fā)展注入強(qiáng)勁動(dòng)力。以信步科技的具身智能硬件開(kāi)發(fā)平臺(tái)HB03,其具身智能“大小腦”融合構(gòu)建了有力的硬件支撐;而浙江人形機(jī)器人創(chuàng)新中心的“領(lǐng)航者2號(hào)NAVIAI”人形機(jī)器人,實(shí)現(xiàn)了可泛化高精準(zhǔn)視覺(jué)伺服、多行為聯(lián)合學(xué)習(xí)的長(zhǎng)序列行為規(guī)劃、視力融合的操作行為學(xué)習(xí)等技術(shù)突破,使得人形機(jī)器人在工業(yè)場(chǎng)景中執(zhí)行復(fù)雜任務(wù)等。
“構(gòu)建良性的產(chǎn)業(yè)生態(tài)一直都是英特爾致力去做的。在具身智能領(lǐng)域,英特爾擁有龐大且健康的ODM產(chǎn)業(yè)群和硬件產(chǎn)業(yè)群,非常有利于推動(dòng)人形機(jī)器人的規(guī)?;l(fā)展;另外,在MCU和傳感器等周邊生態(tài)方面,英特爾也與合作伙伴有著廣泛與緊密的合作;而且在軟件與社區(qū)方面,英特爾也是秉持開(kāi)放的態(tài)度,與機(jī)器人廠商、科研機(jī)構(gòu)和社區(qū)有著深厚的合作基礎(chǔ)?!崩顜r最后表示道。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 小米“玄戒O1”背后的博弈:不是定制,是突圍
- 京東外賣“百億補(bǔ)貼”規(guī)則再調(diào)整:商家承擔(dān)比例升至70%-80%
- 多彩小直屏 直出氛圍感 vivo S30系列正式發(fā)布
- 萬(wàn)豪與美團(tuán)的合作,為酒店的轉(zhuǎn)型難題提供了新思路
- vivo S30系列發(fā)布:多彩配色+撞色中框,國(guó)補(bǔ)價(jià)2294.15元起
- vivo S30系列大膽求變,玩出新格調(diào),拍出氛圍感
- 國(guó)補(bǔ)后2294.15元起!vivo S30系列新機(jī)發(fā)布,綜合體驗(yàn)全面升級(jí)
- 家裝「黑馬」住范兒的啟示
- 關(guān)稅產(chǎn)生影響,印度輸美的iPhone已是中國(guó)三倍多
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。