近年來,應(yīng)用場景的旺盛需求,推動AI領(lǐng)域?qū)⒓夹g(shù)能力從感知延伸到認知、從2D擴展到3D。
3月19日,云從科技基于單幀圖像的3D人體重建技術(shù)同時在Human3.6M、Surreal和UP-3D上創(chuàng)造了最新的世界紀錄,此次突破將原有最低誤差記錄大幅降低30%,也是繼去年云從在3D人臉數(shù)據(jù)集上大幅刷新紀錄后,再次在此類3D重建技術(shù)上取得重要成果。
Human3.6M數(shù)據(jù)集上對比
Surreal數(shù)據(jù)集上對比
UP-3D數(shù)據(jù)集上對比
3D重建領(lǐng)域通常以誤差(Error)作為衡量算法能力的主要指標,誤差(Error)就是生成模型與實際圖像的差別。一般來說,誤差(Error)越低,精度越高,意味著技術(shù)的性能越好。
云從科技3D人體重建技術(shù)全身精度誤差(Surface Error)在Surreal上從75.4毫米降低到52.7毫米,關(guān)節(jié)精度誤差(3DJointError)從55.8毫米降低到40.1毫米,Human3.6M上的關(guān)節(jié)精度誤差(3DJointError)從59.9毫米降低到46.7毫米,技術(shù)的執(zhí)行速度從之前的上百毫秒降低到僅需5毫秒。
論文中,云從科技針對人體具有豐富多樣的姿態(tài)和穿著的特點,提出了一套全新的基于人體3D縱深預(yù)測的3D信息表征方式。通過對三原色圖像(RGB,不含深度信息)的分析,預(yù)測人體的3D形態(tài)和姿勢,并用6萬多個點完整描繪人體,從而在人體重建技術(shù)上取得速度與精度的雙突破,呈現(xiàn)出來的模型更精細,幀率更是高達到200fps,原本由于受實時顯示限制而無法實現(xiàn)的應(yīng)用可以一一實現(xiàn)——這將極大地推動相關(guān)智能圖像應(yīng)用的落地步伐。
由于對輸入圖像的要求低,使3D重建技術(shù)將可以利用普通光學(xué)攝像頭作為感知設(shè)備。該技術(shù)將會使美顏APP無需結(jié)構(gòu)光攝像頭也能具備高精準度的瘦身與動畫合成功能;商場內(nèi)試衣魔鏡將會自動根據(jù)身形生成你所想要更換的衣服,大大節(jié)省商場空間的同時提升用戶體驗度,使更多智能應(yīng)用成為可能。
通過重要人員影像重建、醫(yī)療仿真肢體打印、虛擬試衣、美顏化妝、表情姿態(tài)動畫合成等應(yīng)用場景在大型商場、直播平臺、美顏軟件、影視特效制作等行業(yè)普惠AI能力。
值得一提的是,Human3.6M、Surreal和UP-3D是全球關(guān)于3D人體重建技術(shù)的權(quán)威數(shù)據(jù)集,加州大學(xué)伯克利分校、馬克斯-普朗克研究所、Amazon、賓夕法尼亞大學(xué)、北京大學(xué)、浙江大學(xué)、MicrosoftResearch、法國國家信息與自動化研究所、AdobeResearch等知名企業(yè)、研究所和大學(xué)都在該榜單的競爭隊列中,算法實力比拼可謂激烈,相較于以往,中國企業(yè)與高校機構(gòu)開始逐漸在國外老牌優(yōu)勢領(lǐng)域展露頭角。
與傳統(tǒng)關(guān)鍵點檢測、3D重建技術(shù)的區(qū)別
傳統(tǒng)的人體關(guān)鍵點檢測技術(shù)往往以2D的人體骨骼關(guān)節(jié)點檢測形式出現(xiàn),即通過技術(shù)預(yù)測RGB圖像中人體的十幾個關(guān)節(jié)點的坐標,一方面結(jié)果非常稀疏,將人體大為簡化成骨骼的形式,另一方面結(jié)果往往只包含二維平面上的坐標預(yù)測,不能還原深度信息,因此無法體現(xiàn)縱深的感覺。而基于單幀圖像的3D重建技術(shù)不僅能輸出骨骼關(guān)節(jié)點信息,更能同時預(yù)測大量的人體表面關(guān)鍵點信息,預(yù)測結(jié)果更加豐富,而且每個點的坐標都是3D的,能夠體現(xiàn)不同軀干的縱深信息。
3D關(guān)鍵點檢測
并且傳統(tǒng)3D重建技術(shù)大多需要連續(xù)的圖像序列或是多視角的圖像,在硬件設(shè)備上一般需要采用雙目攝像機或者結(jié)構(gòu)光攝像機等設(shè)備,因此在手機等便攜設(shè)備上往往難以實現(xiàn);另一方面,專用設(shè)備還會增加部署成本,增加大規(guī)模普及3D重建技術(shù)的難度。
基于單幀圖像的3D重建技術(shù)對原始圖像的需求放松的同時,對背后的技術(shù)提出了更難的挑戰(zhàn):技術(shù)需要從單幀圖像中推理出人體或人臉的3D形態(tài),并通過【光學(xué)透視】【陰影疊加】等基本光學(xué)原則準確預(yù)測出各個關(guān)鍵點在3D空間的位置和朝向,從而得到人體的姿態(tài)或表情信息。
人體姿態(tài)和服飾復(fù)雜多樣,精度提升意味著對復(fù)雜場景的適應(yīng)性更好,模型更接近真實的情況。如阿凡達、漫威電影、阿麗塔等電影中,都需要專用特效設(shè)備與面部貼點來完成精細的人像采集,基于單幀圖像的3D人體/人臉重建技術(shù)將徹底顛覆電影視頻的拍攝制作,同時降低工業(yè)級3D動畫合成的門檻。
- 盒馬創(chuàng)始人預(yù)測:美團在快銷品領(lǐng)域超越天貓京東只是遲早的事
- 港科大攜手百望股份,打造金融智能體新篇章:開啟未來經(jīng)濟預(yù)測新紀元
- 特斯拉得州工廠再次停產(chǎn):產(chǎn)能壓力下的困境?
- 網(wǎng)傳持股計劃泡湯,員工成"最慘打工人"事件引爆輿論,廣汽埃安已采取行動辟謠
- 微軟與AMD聯(lián)手打造未來Xbox,揭秘芯片合作新篇章!
- 盒馬創(chuàng)始人:劉強東揭示京東天貓快消品與美團競爭之謎,新零售風(fēng)向標!
- 劉強東坦言:京東面臨挑戰(zhàn),未來五年創(chuàng)新業(yè)務(wù)成破局關(guān)鍵
- 華為助力上海移動5G-A 2.0升級,打造智慧城市新標桿
- 亞馬遜云科技升級三大安全功能,筑牢生成式AI防御城墻
- 羅永浩數(shù)字人:驚艷還是噱頭,背后技術(shù)揭秘
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。