SLAM +機(jī)器學(xué)習(xí)迎來(lái)了“感知時(shí)代”

機(jī)器和深度學(xué)習(xí)的最新進(jìn)展已改進(jìn)了SLAM技術(shù),從而導(dǎo)致地圖的豐富性增加,語(yǔ)義場(chǎng)景理解提高了定位,地圖質(zhì)量和堅(jiān)固性。

最近的危機(jī)使人們?cè)絹?lái)越關(guān)注將自動(dòng)機(jī)器人用于實(shí)際利益。我們已經(jīng)看到機(jī)器人,運(yùn)送食物和藥品,甚至對(duì)患者進(jìn)行評(píng)估。這些都是驚人的用例,它們清楚地說(shuō)明了從現(xiàn)在起機(jī)器人將在我們的生活中發(fā)揮更大作用的方式。

然而,盡管具有所有優(yōu)點(diǎn),但是機(jī)器人自動(dòng)繪制周圍環(huán)境并成功定位自身的能力仍然十分有限。機(jī)器人在計(jì)劃一致的環(huán)境中擅長(zhǎng)做特定事情的能力越來(lái)越強(qiáng)。但是動(dòng)態(tài),未經(jīng)訓(xùn)練的情況仍然是一個(gè)挑戰(zhàn)。

我興奮的是下一代SLAM(同步定位和地圖繪制),它將使機(jī)器人設(shè)計(jì)人員能夠創(chuàng)造出在各種情況下具有更強(qiáng)的自主操作能力的機(jī)器人。它正在開(kāi)發(fā)中,并吸引了整個(gè)行業(yè)的投資和興趣。

我們稱其為“感知時(shí)代”,它將機(jī)器和深度學(xué)習(xí)的最新進(jìn)展結(jié)合起來(lái)以增強(qiáng)SLAM。通過(guò)語(yǔ)義場(chǎng)景理解來(lái)增加地圖的豐富度,可以改善定位,地圖質(zhì)量和堅(jiān)固性。

簡(jiǎn)化地圖

目前,大多數(shù)SLAM解決方案都從傳感器獲取原始數(shù)據(jù),并使用概率算法來(lái)計(jì)算機(jī)器人的位置和地圖。LIDAR是最常用的,但成本越來(lái)越低的相機(jī)為增強(qiáng)的地圖提供了豐富的數(shù)據(jù)流。無(wú)論使用哪種傳感器,數(shù)據(jù)都會(huì)創(chuàng)建由數(shù)百萬(wàn)個(gè)3維參考點(diǎn)組成的地圖。這些使機(jī)器人可以計(jì)算其位置。

問(wèn)題在于這些3D點(diǎn)云沒(méi)有意義-它們只是機(jī)器人計(jì)算其位置的空間參考。不斷處理所有這些數(shù)百萬(wàn)個(gè)點(diǎn)也是機(jī)器人處理器和內(nèi)存的沉重負(fù)擔(dān)。通過(guò)將機(jī)器學(xué)習(xí)插入到處理“流水線”中,我們既可以提高這些地圖的實(shí)用性,又可以簡(jiǎn)化它們。

全景分割

技術(shù)使用機(jī)器學(xué)習(xí)將來(lái)自攝像機(jī)供稿的像素集合分類為可識(shí)別的“對(duì)象”。例如,代表墻壁的數(shù)百萬(wàn)個(gè)像素可以歸類為單個(gè)對(duì)象。此外,我們可以使用機(jī)器學(xué)習(xí)來(lái)預(yù)測(cè)3D世界中這些像素的幾何形狀和形狀。因此,代表一堵墻的數(shù)百萬(wàn)個(gè)3D點(diǎn)可以全部匯總到一個(gè)平面中。

數(shù)以百萬(wàn)計(jì)的代表椅子的3D點(diǎn)都可以匯總到帶有少量參數(shù)的形狀模型中。將場(chǎng)景分解為2D和3D的不同對(duì)象可以降低處理器和內(nèi)存的開(kāi)銷。

令我興奮的是下一代SLAM,它將使機(jī)器人設(shè)計(jì)人員能夠創(chuàng)造出在各種情況下能夠自主運(yùn)行的機(jī)器人。它正在開(kāi)發(fā)中,并吸引了整個(gè)行業(yè)的投資和興趣。

增加理解

以及簡(jiǎn)化地圖,此方法為進(jìn)一步了解機(jī)器人的傳感器捕獲的場(chǎng)景提供了基礎(chǔ)。通過(guò)機(jī)器學(xué)習(xí),我們能夠?qū)?chǎng)景中的單個(gè)對(duì)象進(jìn)行分類,然后編寫代碼來(lái)確定應(yīng)如何處理它們。

這種新興功能的首要目標(biāo)是能夠從地圖上移除包括人在內(nèi)的移動(dòng)物體。為了有效導(dǎo)航,機(jī)器人需要引用場(chǎng)景的靜態(tài)元素。不會(huì)移動(dòng)的東西,因此可以用作可靠的定位點(diǎn)。機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場(chǎng)景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。將場(chǎng)景中的對(duì)象的全景分割與基礎(chǔ)地圖和位置數(shù)據(jù)相結(jié)合,將很快大大提高機(jī)器人SLAM的準(zhǔn)確性和功能。

感知對(duì)象

下一個(gè)激動(dòng)人心的步驟將是基于此分類,以增加對(duì)單個(gè)對(duì)象的理解水平。機(jī)器學(xué)習(xí)作為SLAM系統(tǒng)的一部分,將使機(jī)器人能夠?qū)W習(xí)將房間的墻壁和地板與家具和房間內(nèi)的其他物體區(qū)分開(kāi)。將這些元素存儲(chǔ)為單獨(dú)的對(duì)象意味著添加或刪除椅子無(wú)需完全重繪地圖。

這些優(yōu)勢(shì)的結(jié)合是自主機(jī)器人功能取得巨大進(jìn)步的關(guān)鍵。機(jī)器人在未經(jīng)訓(xùn)練的情況下不能很好地推廣。變化,尤其是快速移動(dòng)會(huì)破壞地圖并增加大量計(jì)算量。機(jī)器學(xué)習(xí)創(chuàng)建了一層抽象,可以提高地圖的穩(wěn)定性。它在處理數(shù)據(jù)方面的更高效率產(chǎn)生了開(kāi)銷,以增加更多的傳感器和更多的數(shù)據(jù),從而增加了粒度和可包含在地圖中的信息,更多信息盡。

機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場(chǎng)景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。

自然互動(dòng)

將位置,地圖和感知鏈接在一起,使機(jī)器人可以更多地了解其周圍環(huán)境并以更有用的方式進(jìn)行操作。例如,可以感知大廳和廚房之間差異的機(jī)器人可以執(zhí)行更復(fù)雜的指令集。能夠識(shí)別和分類椅子,書(shū)桌,櫥柜等物體將進(jìn)一步改善這一點(diǎn)。指示機(jī)器人去特定的房間去獲取特定的東西將變得更加簡(jiǎn)單。

當(dāng)機(jī)器人開(kāi)始以更自然的方式與人進(jìn)行更多互動(dòng)時(shí),機(jī)器人技術(shù)的真正革命將來(lái)臨??梢詮亩喾N情況中學(xué)習(xí)并將這些知識(shí)組合到模型中的機(jī)器人,這些機(jī)器人可以使它們根據(jù)存儲(chǔ)在內(nèi)存中的地圖和對(duì)象執(zhí)行未經(jīng)訓(xùn)練的新任務(wù)。創(chuàng)建這些模型和抽象需要將SLAM的所有三層完全集成。由于在這些領(lǐng)域處于領(lǐng)先地位的人們的努力,我相信感知時(shí)代即將來(lái)臨,更多信息盡在振工鏈。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-07-30
SLAM +機(jī)器學(xué)習(xí)迎來(lái)了“感知時(shí)代”
機(jī)器和深度學(xué)習(xí)的最新進(jìn)展已改進(jìn)了SLAM技術(shù),從而導(dǎo)致地圖的豐富性增加,語(yǔ)義場(chǎng)景理解提高了定位,地圖質(zhì)量和堅(jiān)固性。最近的危機(jī)使人們?cè)絹?lái)越關(guān)注將自動(dòng)機(jī)器人用于實(shí)際利益。

長(zhǎng)按掃碼 閱讀全文