極客網(wǎng)·極客觀察10月22日(朱飛) 一人,一車,一無(wú)人機(jī),飛馳在最美的318川藏線。無(wú)人機(jī)飛上天空,不再是單調(diào)的跟拍,而是全方位記錄“人車合一”的風(fēng)馳電掣、瀟灑漂移。遇到標(biāo)志建筑或民族舞蹈,還會(huì)自動(dòng)規(guī)劃線路拍攝全貌,生成精彩影像片段……這樣的美妙場(chǎng)景,你是否曾在腦中盤算憧憬?
不需要高超的專業(yè)技術(shù)和高昂的時(shí)間成本,一樣可以拍出精彩絕倫的影像作品。這可能是大多數(shù)熱愛(ài)攝影、熱愛(ài)生活的人的共同夢(mèng)想!
在剛剛落幕的第七屆中國(guó)國(guó)際“互聯(lián)網(wǎng)+”大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽上,有一群擁有相同夢(mèng)想的大學(xué)生,創(chuàng)新開(kāi)發(fā)出自動(dòng)攝影方面的“黑科技”——基于昇騰AI基礎(chǔ)軟硬件平臺(tái)搭建的AI智能攝影系統(tǒng)——一舉斬獲大賽產(chǎn)業(yè)命題賽道銀獎(jiǎng),叩開(kāi)了AI智能攝影的大門。
從硬件開(kāi)發(fā)到軟件設(shè)計(jì),從智能攝影及感知算法到攝影設(shè)備控制算法,再到系統(tǒng)集成和應(yīng)用落地……基于全棧AI技術(shù),這支來(lái)自浙江工業(yè)大學(xué)名為“翼瞰智能”的年輕團(tuán)隊(duì)積極將想法付諸行動(dòng),用AI給無(wú)人機(jī)的攝像系統(tǒng)裝上“大腦”,初步展現(xiàn)了AI智能攝影的智慧能力及應(yīng)用天地。
直擊痛點(diǎn),以“算法”代替“手法”
在這個(gè)軟件定義世界的時(shí)代,隨著人工智能呼嘯而來(lái),AI算法正在重新定義各種軟件的運(yùn)作方式。
當(dāng)能夠一定程度解決大眾拍照焦慮的AI攝影在手機(jī)端大受歡迎后,長(zhǎng)期研究無(wú)人機(jī)和元學(xué)習(xí)相關(guān)領(lǐng)域的翼瞰智能團(tuán)隊(duì)負(fù)責(zé)人俞天緯敏銳地覺(jué)察到,無(wú)人機(jī)的攝影也可以因AI變得更智能,從而進(jìn)入更多應(yīng)用領(lǐng)域。
實(shí)際上,以無(wú)人機(jī)為代表的移動(dòng)拍攝設(shè)備,近年來(lái)已在一些領(lǐng)域得到應(yīng)用。但翼瞰智能團(tuán)隊(duì)認(rèn)為,疊加AI智能攝影功能后,這些設(shè)備將在諸如影視鏡頭拍攝、體育賽事直播、環(huán)境污染檢測(cè)、公共安全檢測(cè)等場(chǎng)景具備更廣闊的應(yīng)用天地。
比如在影視和體育賽事拍攝中,很多場(chǎng)景需要長(zhǎng)鏡頭跟蹤俯拍、高機(jī)動(dòng)的移動(dòng)拍攝,以及對(duì)單個(gè)或多個(gè)目標(biāo)的跟拍等,這要求無(wú)人機(jī)等移動(dòng)拍攝設(shè)備具備跟蹤目標(biāo)運(yùn)動(dòng)狀態(tài)自動(dòng)拍攝的能力,同時(shí)在行進(jìn)路線中要能夠自主避障以保障安全。而在環(huán)境污染檢和公共安全檢測(cè)等場(chǎng)景中,還需具備異常事件/行為的智能識(shí)別和檢測(cè)能力。
顯然,傳統(tǒng)的人工攝影或非智能攝影方式,很難滿足上述要求。一方面,實(shí)現(xiàn)同等效果人工攝影需要花費(fèi)很長(zhǎng)的時(shí)間和精力,有時(shí)甚至需要冒生命危險(xiǎn)去拍攝;另一方面,當(dāng)前設(shè)備的自動(dòng)攝影模式往往無(wú)法滿足高階要求,手動(dòng)攝影則需要調(diào)整大量參數(shù)和熟練的攝影手法配合,智能化和效率雙低;再者,當(dāng)前市場(chǎng)上的一些智能攝影設(shè)備只預(yù)留了少量接口,可擴(kuò)展性差,無(wú)法滿足上面提到的安全檢測(cè)等延伸需求。
如何破題?翼瞰智能團(tuán)隊(duì)的答案是以“算法”代替“手法”,即以基于AI的智能攝影及感知、智能設(shè)備控制等算法,去代替人工手法操控拍攝設(shè)備,達(dá)成拍攝及其他效果。
簡(jiǎn)言之,翼瞰智能做法就是用AI去學(xué)習(xí)模仿專業(yè)攝影師的攝影手法,獲取包括其運(yùn)動(dòng)軌跡、空間位置等數(shù)據(jù)信息,形成一個(gè)個(gè)“模板”,使得其他人在其他場(chǎng)景想要達(dá)到同樣效果時(shí),無(wú)需人工設(shè)定移動(dòng)相機(jī)的參數(shù)及運(yùn)動(dòng)軌跡,攝像機(jī)就能自主輕松地實(shí)現(xiàn)。
全棧創(chuàng)新,AI智能自主攝影不是夢(mèng)
要開(kāi)發(fā)這樣的AI算法并將之投入應(yīng)用驗(yàn)證,首當(dāng)其沖的便是要選擇一個(gè)合適的AI算力底座,以及相匹配的AI開(kāi)發(fā)框架。
俞天緯透露,實(shí)際上在參加本次大賽之前,其團(tuán)隊(duì)已經(jīng)研究無(wú)人機(jī)智能攝影、無(wú)人機(jī)自動(dòng)控制,以及硬件電路板開(kāi)發(fā)等方面做了很多研究。此前的模型訓(xùn)練和部署,是基于谷歌的TensorFlow和英偉達(dá)的Jetson TX2開(kāi)發(fā)板去做的,過(guò)程中遇到兩個(gè)突出問(wèn)題:一是Jetson TX2的算力不是很高,不能完全滿足要求;二來(lái)TensorFlow與Jetson TX2分屬兩家,沒(méi)有緊密的融合。
借大賽新增產(chǎn)業(yè)命題賽道的契機(jī),團(tuán)隊(duì)決定“另起爐灶”,基于昇騰全場(chǎng)景人工智能平臺(tái)能力,從硬件開(kāi)發(fā)板的設(shè)計(jì),到軟件算法的開(kāi)發(fā),再到系統(tǒng)集成及場(chǎng)景驗(yàn)證,“三步走”打造一個(gè)基于全棧AI技術(shù),且有具體落地場(chǎng)景的AI智能攝影系統(tǒng)。
首先,翼瞰智能團(tuán)隊(duì)圍繞Atlas 200 AI加速模塊,結(jié)合以往的研發(fā)積累,自主設(shè)計(jì)了核心SoC電路板。Atlas 200 AI加速模塊可提供22 TOPS INT8算力,澎湃算力可全面滿足無(wú)人機(jī)、機(jī)器人、可移動(dòng)相機(jī)等設(shè)備的智能攝影需求。
同時(shí),借助昇騰異構(gòu)計(jì)算架構(gòu)CANN(Compute Architecture for Neural Networks)軟硬件協(xié)同優(yōu)化,充分釋放Atlas 200 AI加速模塊的澎湃算力。利用先進(jìn)的自動(dòng)算子融合、異構(gòu)計(jì)算調(diào)度、智能算子調(diào)優(yōu)技術(shù),讓CANN成為了提升這套智能攝影系統(tǒng)AI計(jì)算效率的關(guān)鍵平臺(tái)。更讓整個(gè)團(tuán)隊(duì)興奮的是,CANN還提供了開(kāi)放易用的ACL(Ascend Computing Language)編程接口,在滿足高效便捷地二次開(kāi)發(fā)同時(shí)也可支撐后續(xù)多樣化的需求演進(jìn),這也讓CANN成為支撐人工智能計(jì)算生態(tài)發(fā)展的關(guān)鍵。
其次,基于與昇騰處理器緊密融合的昇思MindSpore AI框架,團(tuán)隊(duì)開(kāi)發(fā)了系列算法。在智能攝影及感知算法上,得益于軟硬件的深度協(xié)同,團(tuán)隊(duì)在單目深度估計(jì)算法上相比傳統(tǒng)方法提速了5.8倍;設(shè)計(jì)實(shí)現(xiàn)了基于強(qiáng)化學(xué)習(xí)的自主攝影算法,性能領(lǐng)先DJI Active Track攝影模式3倍;在3D AI環(huán)境識(shí)別模型上,也比國(guó)際領(lǐng)先的算法精度提升了23%。同時(shí)在移動(dòng)攝影設(shè)備控制算法上,團(tuán)隊(duì)開(kāi)發(fā)了視覺(jué)-慣導(dǎo)融合的目標(biāo)跟蹤技術(shù),基于硬約束的路徑重規(guī)劃技術(shù),以及基于EGO空間的主動(dòng)避障技術(shù),大大減小了的跟蹤誤差,提升了安全路徑規(guī)劃率,提高了自主避障可靠性。
最后,團(tuán)隊(duì)對(duì)上述所有核心技術(shù)進(jìn)行系統(tǒng)集成,形成一個(gè)可裝配應(yīng)用的模塊,并率先將其搭載到無(wú)人機(jī)攝影場(chǎng)景中,在智能自主攝影、智能跟蹤及輔助安全方面取得優(yōu)異表現(xiàn)。
據(jù)俞天緯介紹,團(tuán)隊(duì)此前針對(duì)YouTube視頻上的20種基本拍攝動(dòng)作做了AI智能學(xué)習(xí),結(jié)果顯示無(wú)論是從人物在視頻當(dāng)中的位置,還是面部朝向,以及整個(gè)鏡頭的移動(dòng)速度、角度等,都給人非常接近的感覺(jué)。問(wèn)卷調(diào)查顯示有89%的人都覺(jué)得新片與原片效果很相近。本次基于昇騰AI全棧能力“重塑”項(xiàng)目后,其“還原度”無(wú)疑又得到了進(jìn)一步提升。
產(chǎn)教融合,AI點(diǎn)燃創(chuàng)業(yè)創(chuàng)新之火
AI智能攝影,讓人人都能輕松拍出大片,這樣的能力在當(dāng)下這個(gè)短視頻/直播無(wú)處不在的時(shí)代,別提有多令人興奮。但最讓筆者感興趣的,還是基于這個(gè)基礎(chǔ)功能之上的行業(yè)深度應(yīng)用,包括上文提到的環(huán)境污染檢測(cè)、公共安全檢測(cè),以及更多的機(jī)器視覺(jué)、圖像識(shí)別類AI應(yīng)用等。它們一旦被安上AI的“大腦”和智能攝影的“眼睛”,無(wú)疑將迸發(fā)出更大的社會(huì)和經(jīng)濟(jì)價(jià)值。
這其實(shí)正是當(dāng)前AI從單一領(lǐng)域、局部應(yīng)用走向千行百業(yè)、全面應(yīng)用的一個(gè)寫(xiě)照。作為一種劃時(shí)代的通用目的技術(shù),AI不僅可以使人們以更高的效率處理傳統(tǒng)行業(yè)亟待優(yōu)化的問(wèn)題,也可以在很多還沒(méi)有解決的問(wèn)題上取得新的突破,是推動(dòng)社會(huì)經(jīng)濟(jì)持續(xù)發(fā)展、構(gòu)筑未來(lái)領(lǐng)先競(jìng)爭(zhēng)力的關(guān)鍵,值得產(chǎn)業(yè)各界、千行百業(yè)深度耕耘。
本屆中國(guó)國(guó)際“互聯(lián)網(wǎng)+”大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽新增產(chǎn)業(yè)命題賽道,面向新工科、新農(nóng)科、新文科、新醫(yī)科對(duì)應(yīng)行業(yè)產(chǎn)業(yè)領(lǐng)域,加強(qiáng)產(chǎn)教融合促進(jìn)教育鏈、人才鏈與產(chǎn)業(yè)鏈、創(chuàng)新鏈的有機(jī)銜接,讓一批對(duì)于社會(huì)發(fā)展有幫助的優(yōu)質(zhì)科技孵化項(xiàng)目從實(shí)驗(yàn)室走向轉(zhuǎn)化應(yīng)用,并啟迪大學(xué)生們?cè)谛聲r(shí)代創(chuàng)新創(chuàng)業(yè)的征途中創(chuàng)出美好未來(lái),可謂意義非凡。
作為本屆“互聯(lián)網(wǎng)+”大賽的重要合作伙伴,華為深入?yún)⑴c產(chǎn)業(yè)命題賽道,通過(guò)對(duì)學(xué)科知識(shí)與行業(yè)實(shí)踐的高度融合,將極高價(jià)值的產(chǎn)業(yè)任務(wù)轉(zhuǎn)化為包含昇騰AI、鯤鵬、華為云、CT、消費(fèi)者云、OpenHarmony等系列前沿領(lǐng)域在內(nèi)的32道創(chuàng)新命題項(xiàng)目,吸引了337所高校的1205支隊(duì)伍近萬(wàn)名院校學(xué)生參與其中,并以全方位的資源支持和培訓(xùn)指導(dǎo)助力13支華為命題隊(duì)伍進(jìn)入決賽斬獲大獎(jiǎng),可以說(shuō)正當(dāng)其時(shí)。
作為參賽并獲獎(jiǎng)的隊(duì)伍之一,俞天緯表示翼瞰智能團(tuán)隊(duì)在用昇騰全場(chǎng)景人工智能平臺(tái)開(kāi)發(fā)部署智能攝影算法時(shí)得到了昇騰社區(qū)人員的大力支持,“基本上我們有什么問(wèn)題,他們一看到很快就回復(fù)了。沒(méi)回復(fù)的也會(huì)給我們留言告訴怎么解決??梢哉f(shuō)大部分,99%的問(wèn)題都可以通過(guò)他們的回復(fù)來(lái)解決,少走了很多彎路。我們深刻感受到了昇騰AI全棧技術(shù)及生態(tài)的成長(zhǎng)壯大?!?/p>
而在這背后,華為與教育部合作的“智能基座”產(chǎn)教融合協(xié)同育人項(xiàng)目已經(jīng)覆蓋包括浙江工業(yè)大學(xué)在內(nèi)的72座高校,昇騰AI、鯤鵬、華為云等前沿技術(shù)知識(shí)已經(jīng)以教材教輔的形式融入到這些高校計(jì)算機(jī)、人工智能等專業(yè)師生的日常教學(xué)和科研中;同時(shí)還通過(guò)“鯤鵬、昇騰優(yōu)才&眾智計(jì)劃”支持學(xué)生與產(chǎn)業(yè)接軌,理解產(chǎn)業(yè)的真實(shí)需求,提升綜合創(chuàng)新能力。
“目前團(tuán)隊(duì)已發(fā)表國(guó)際高水平學(xué)術(shù)論文30余篇,授權(quán)發(fā)明專利30余項(xiàng),申請(qǐng)受理專利10余項(xiàng),多項(xiàng)成果均達(dá)到國(guó)際領(lǐng)先水平。”俞天緯透露,面向未來(lái)翼瞰智能還將繼續(xù)基于昇騰AI全棧軟硬件平臺(tái)能力深度優(yōu)化AI智能攝影系統(tǒng),并將智能攝影核心模塊推向更多的移動(dòng)攝像設(shè)備及應(yīng)用場(chǎng)景。
AI創(chuàng)未來(lái),“昇騰”正當(dāng)時(shí)!大賽豐碩成果及其背后產(chǎn)教融合新模式只是一個(gè)縮影,相信隨著人工智能、大數(shù)據(jù)、5G等新一代信息技術(shù)與創(chuàng)新創(chuàng)業(yè)的深度融合,AI的星辰大海將全面開(kāi)啟!
- 報(bào)告稱83%的Z世代愿與AI結(jié)婚 專家警告本質(zhì)上屬于"行為上癮"
- 鯤鵬向“智”,“轅”啟未來(lái)
- 人形機(jī)器人格斗首秀背后:一場(chǎng)生態(tài)體系的中美較量
- 開(kāi)放創(chuàng)新托舉產(chǎn)業(yè)生態(tài),昇騰AI持續(xù)升騰
- 硅基模型vs.碳基大腦:AI能否成為超越人類的超級(jí)預(yù)測(cè)者?
- 1ms城市算網(wǎng)中國(guó)行正式啟動(dòng),城市數(shù)字化發(fā)展迎新方向
- “創(chuàng)新取實(shí)”vs.“投機(jī)主義”:5G與ORAN六年發(fā)展結(jié)果迥異
- AI遭遇生產(chǎn)力和營(yíng)收困境,“索洛悖論”正在重演?
- 特朗普極力向沙特推銷AI 項(xiàng)目能否落地要打個(gè)問(wèn)號(hào)
- 華為鴻蒙電腦來(lái)了!真正挑戰(zhàn)Wintel的先鋒力量
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。