2022 年的 3 月,或將被寫入自動駕駛史冊——美國頒布無人駕駛法規(guī),中國也許將從政策層面允許 L3 自動駕駛乘用車上路,國內首條支持自動駕駛的快速路通車運營…… 毫無疑問,自動駕駛已經(jīng)逐漸從快速迭代邁入大規(guī)模落地階段。在這個 “臨門一腳” 的關鍵時刻,想要讓汽車本身的算法做到處理更多、更復雜的場景,不可或缺的是海量的場景數(shù)據(jù)支撐。
通過對話國內唯一 A 股上市數(shù)據(jù)服務商—海天瑞聲,透視 AI 數(shù)據(jù)在助推自動駕駛實現(xiàn)的路上,所面臨的機會與挑戰(zhàn)。
一、自動駕駛數(shù)據(jù)迎來爆發(fā)期
2022 年將會是自動駕駛商業(yè)化轉折點。
回溯 2021 年底,北京成為國內首個明確認可 「 RoboTaxi 」 商業(yè)化試點的城市,標志著國內自動駕駛賽道迎來商業(yè)化運營階段。
相關數(shù)據(jù)和圖片來自 36 氪、漢能投資發(fā)布的《2022 中國自動駕駛行業(yè)研究報告》
Gartner 公司 2022 年汽車行業(yè)十大業(yè)務趨勢
常規(guī)自動駕駛汽車服務啟動,挑戰(zhàn)隨之而來,也是值得關注的業(yè)務趨勢之一
目前,自動駕駛主流算法模型主要以有監(jiān)督學習為主,這需要大量的標注數(shù)據(jù)對模型進行訓練和調優(yōu)。只有通過各個場景的數(shù)據(jù)迭代,自動駕駛才可能真正落地。
是否能高效獲取大量標注數(shù)據(jù)直接決定了各家能否獲得自動駕駛市場上的先發(fā)優(yōu)勢。
盡管一些行業(yè)頭部企業(yè)已經(jīng)內部搭建起數(shù)據(jù)標注團隊,訓練數(shù)據(jù)服務商依然是它們背后無法忽略的存在。
作為國內訓練數(shù)據(jù)行業(yè)的領頭羊,海天瑞聲近幾年也開始與一些傳統(tǒng)車企、造車新勢力以及頭部自動駕駛技術公司合作,探索如何幫助合作伙伴最大程度釋放自動駕駛數(shù)據(jù)的價值。
IDC 預測,到 2025 年,中國人工智能數(shù)據(jù)采標服務市場規(guī)模將達到 123.4 億元人民幣。市場的發(fā)展驅動力一方面來源于人工智能市場的迅猛發(fā)展,另一方面來源于行業(yè)用戶加大數(shù)據(jù)采集力度。
IDC 數(shù)據(jù)顯示,自動駕駛也是 AI 基礎服務市場當中最具增長潛力的行業(yè)
二、把好「第一關」:數(shù)據(jù)方案的設計能力
與智能家居、新零售、安防等垂直領域相比,自動駕駛的數(shù)據(jù)需求格外“苛刻”,對數(shù)據(jù)服務商也提出了新的挑戰(zhàn)。
例如,數(shù)據(jù)樣本豐富度層面,場景覆蓋全面的數(shù)據(jù)集對自動駕駛系統(tǒng)安全性至關重要。想象一下,如果高速路上突然出現(xiàn)一群野象,或者突然有人橫穿馬路,自動駕駛汽車該如何應對?
這類 Corner case 數(shù)據(jù)很難采集,我們不可能真的找一群野象去高速上漫步,然后采集數(shù)據(jù)。
對于這些現(xiàn)實生活中完全有可能發(fā)生的情況,系統(tǒng)如果識別不了,將會導致嚴重的后果甚至生命損失。所以,相應的數(shù)據(jù)必不可少,無論是通過技術手段合成還是模擬,數(shù)據(jù)方案的設計能力都尤為重要。
此時,海天瑞聲作為綜合數(shù)據(jù)服務商的顯著優(yōu)勢就凸顯出來:總的說來,行業(yè)現(xiàn)階段訓練數(shù)據(jù)采集標注的定制化需求較多,海天瑞聲在基礎研究上的多年積累,使得其能夠更好把握現(xiàn)有技術方向,深入了解客戶對訓練數(shù)據(jù)的運用邏輯和需求痛點,保證客戶算法取得盡可能好的落地效果。
具體到自動駕駛項目需求上,海天瑞聲在項目啟動前會安排專業(yè)團隊先根據(jù)需求設計好訓練數(shù)據(jù)集結構,讓容量有限的訓練數(shù)據(jù)集能夠覆蓋盡可能多的現(xiàn)象,并制定相應合理的數(shù)據(jù)比例。
比如,項目如果涉及卡車,覆蓋高速路場景的比例會很高,上下閘道之類的相關場景也要考慮到;如果涉及市內乘用車,設計方案時需要覆蓋各種路口情況,諸如三叉路的十字路口、轉向線等,有沒有掉頭的,或者不是兩側掉頭的,甚至左轉道在最右側等罕見情況,都要覆蓋到。
為了讓數(shù)據(jù)集更完整、豐富,諸如道路兩側場景、路上障礙物,車輛擁擠、稀疏以及行人多少之類情況也要提前考慮,特別是一些突發(fā)情況,比如突然橫穿馬路,盡管這種場景的覆蓋難度會更大。
海天瑞聲自動駕駛數(shù)據(jù)業(yè)務的主要內容
有時,客戶也并不清楚什么樣的數(shù)據(jù)方案更符合算法需求。例如較之經(jīng)驗相對豐富的互聯(lián)網(wǎng)大廠,傳統(tǒng)車企更需要擁有豐富方案設計經(jīng)驗的服務商,幫忙引導、梳理并細化出具體需求。
比如,面對突發(fā)狀況司機踩剎車,對于自動駕駛決策系統(tǒng)來說,急剎車之前多少秒的數(shù)據(jù)更有價值?低可視度惡劣天氣場景的數(shù)據(jù)量需要多少?需要以何種方式采集?以多少秒一幀的速度采集?
通過技術對技術、算法層面的反復溝通,海天瑞聲可以幫助客戶找到更加貼合使用場景的數(shù)據(jù)方案,縮減研發(fā)周期、加快落地進程,同時避免客戶花費更多成本。
三、「人機耦合」下的精度、效率與規(guī)模
高質量自動駕駛訓練數(shù)據(jù),除了來自樣本豐富度的“刁難”,還要面臨標注過程高精度、高效率規(guī)?;鳂I(yè)帶來的挑戰(zhàn)。
舉例來說,同樣是 99% 精準度,對語音合成任務中的大多場景來說已經(jīng)足夠優(yōu)質,但對于自動駕駛場景來說,卻極有可能埋下安全隱患。
基于對安全性的嚴苛要求,智能駕駛數(shù)據(jù)(主要是艙外)正朝著多模態(tài)的方向發(fā)展,所謂多模態(tài),是指多維時間、空間、環(huán)境數(shù)據(jù)的感知與融合。比如,一輛車可能配置少則 4-5 個、多則十幾個攝像頭,外加雷達(激光雷達、毫米波雷達、超聲波雷達等)。
市面采用的激光雷達基本都是 64 線甚至以上,受限于各種硬件設備,傳回來的數(shù)據(jù)很難做到完全同步。由于點云是一個連續(xù)幀的概念,標注多路數(shù)據(jù)如果不一致,會影響到算法模型訓練。另一方面,3D 激光雷達數(shù)據(jù)和 2D 普通攝像頭數(shù)據(jù)標注如何同步,也是一個難點。這些都成為橫亙在高精度標注需求面前的難題。
與此相對應的卻是標注環(huán)節(jié)生產力的落后。
訓練數(shù)據(jù)生產過程示意圖
《2019 年中國人工智能基礎數(shù)據(jù)服務行業(yè)白皮書》分析指出,2010-2016 年早期數(shù)據(jù)標注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。直到今天,絕大部分數(shù)據(jù)服務商還處于解決「數(shù)據(jù)標注工具有無」的階段。
很多團隊依靠開源工具完成絕大部分項目,不僅沒有點云標注工具,基本流程管理也沒有(比如,哪類數(shù)據(jù)應該被篩選?質量不合格的標注該怎么辦?),根本不可能交付自動駕駛所需的高質量、高精度數(shù)據(jù)集。
而伴隨 AI 在出行領域的深入落地,智能駕駛級別越高,所需的傳感器數(shù)量則越多、精度要求也越高,相應的數(shù)據(jù)量就會急劇增加,一個項目動輒數(shù)百萬條的數(shù)據(jù)處理量,早已不是作坊式作業(yè)可以應對。
例如,Waymo Open Dataset 有 16.7 個小時的視頻數(shù)據(jù),3,000 個駕駛場景,60 萬視頻幀,將近 200 萬 3D 多邊形和 2200 萬 2D 多邊形標注,而這只是 Waymo 大量私有自動駕駛數(shù)據(jù)集的一小部分。
快速變化的市場環(huán)境,對數(shù)據(jù)交付工期的要求也更為苛刻,只有更加自動化、智能化、平臺化的數(shù)據(jù)服務,才能更好地滿足客戶需求。
作為浸潤行業(yè)十幾年的頭部服務商,海天瑞聲從成立之初,就在摸索各環(huán)節(jié)人機協(xié)作的可能,實現(xiàn)數(shù)據(jù)標注服務質量、速度和規(guī)?;淖罴哑胶?。
一體化數(shù)據(jù)處理平臺示意圖
其十多項核心技術應用于訓練數(shù)據(jù)生產的設計、采集、加工、質檢中,自主研發(fā)一體化數(shù)據(jù)處理平臺,將項目流程管理、質量把控、數(shù)據(jù)安全管理融入其中,并嵌入上千款自主開發(fā)積累的,適用于各種業(yè)務場景訓練數(shù)據(jù)處理需求的工具,充分提高了數(shù)據(jù)訓練的生產效率與質量控制水平。
具體到自動駕駛場景,一般人眼中,3D 點云只是一片點狀物,很難直觀看出具體是什么。但資深標注員會就同一個連續(xù)幀的前、后幾幀來回看,有時還會搭配 2D 圖片一起看,「腦補」點云數(shù)據(jù)無法呈現(xiàn)的部分。
海天瑞聲自動駕駛標注平臺有一個叫做「輔助構建物體腦補框」的工具,能幫助標注員進行更為精確的「腦補」。比如,拉框后,系統(tǒng)會自動就同一個連續(xù)幀的前、后幾幀內容進行預判,還會給出一些諸如車輛大小的參考。
其次,這一標注平臺覆蓋自動駕駛場景下不同類型數(shù)據(jù)的標注工具,能夠大幅提升標注效率。例如,平臺支持 3D 點云標注、3D 點云連續(xù)幀標注、3D 連續(xù)幀與 2D 聯(lián)合的標注、3D 語義分割等,還可根據(jù)客戶的個性化需求對平臺工具進行二次開發(fā),當屬業(yè)內領先。
海天瑞聲 3D 點云標注平臺
3D 點云連續(xù)幀標注時,前兩幀標注的物體,自動化工具會在第三幀上自動預測物體位置。由于算法會先介入做判斷,標注員的工作很大程度上是一個校正過程,效率和準確率都有極大的保證。
最后,一體化數(shù)據(jù)處理平臺的先進性不僅在于提供了統(tǒng)一入口和統(tǒng)一風格,有助于提升數(shù)據(jù)采集、加工效率,還將公司多年行業(yè)深耕經(jīng)驗沉淀到平臺上,不僅簡化并統(tǒng)一了訓練數(shù)據(jù)生產流程,模塊式的項目生成和管理方式使得生產人員可以根據(jù)實際項目需求有機結合、靈活調整。
四、系統(tǒng)化平臺:落腳質保與安全
除了精度、效率和規(guī)?;?,一體化平臺還能為數(shù)據(jù)標注質量保駕護航。
質量檢測和控制理念被嵌入到平臺各環(huán)節(jié)工具之中:比如在采集環(huán)節(jié),采集工具可對原始數(shù)據(jù)質量進行即時質檢,不符合要求的原始數(shù)據(jù)會被系統(tǒng)工具提示因某項要求不達標,無法錄入;中端加工環(huán)節(jié),運用自動標注工具 + 人工校對檢驗的方式,對數(shù)據(jù)標注情況進行檢查,提升數(shù)據(jù)質量;在后端大規(guī)模質檢環(huán)節(jié),運用全自動校驗技術,實現(xiàn)大規(guī)模訓練數(shù)據(jù)集 100% 的質檢需求。
目前,海天瑞聲一體化平臺已經(jīng)沉淀數(shù)百個質檢點,可滿足所有日常業(yè)務場景需求,如檢驗圖片、視頻文件格式是否正確、物體種類數(shù)量是否達標,打點標框準確率是否符合要求等。
其實,人機協(xié)作下的高效率、高質量數(shù)據(jù)標注,只是數(shù)據(jù)服務整體流程中的一部分。數(shù)據(jù)集管理、項目管理、團隊人員管理等與數(shù)據(jù)安全、合規(guī)息息相關,同樣不可忽略。
與一體化數(shù)據(jù)處理平臺相配合,海天瑞聲還建立了全時日志庫及終端人管理系統(tǒng),實現(xiàn)平臺內操作留痕、透明可追溯和平臺內不同角色的嚴格權限分級,確保數(shù)據(jù)安全。
針對不同安全等級的訴求,海天瑞聲可以提供不同級別的解決方案??蛻艨梢园褦?shù)據(jù)放在海天的平臺上來做,也可以部署到自己服務器,甚至還能提供入場標注。
隨著國家大舉培養(yǎng)數(shù)據(jù)要素市場、數(shù)據(jù)流通持續(xù)改善,《網(wǎng)絡安全法》《數(shù)據(jù)安全法》與《個人信息保護法》等上位法的陸續(xù)發(fā)布,數(shù)據(jù)安全與隱私保護也得到社會各界越來越多的關注。
海天瑞聲也率先通過了 ISO/IEC 27701 認證,這意味著,其數(shù)據(jù)生產過程中個人隱私信息安全管理和保護能力符合「重要的全球性隱私保護標準」,也通過了「最嚴苛資質的審核」。
如今,個人信息從設計、采集、處理、質檢到交付均已嚴格管控在平臺范圍內,并通過標準化的數(shù)據(jù)脫敏、嚴格的終端人管理系統(tǒng)、隱私程度分級及權限隔離、全時自動監(jiān)控等措施全流程保障個人隱私信息的安全。
長遠來看,只有在安全、合規(guī)的角度下樹立數(shù)據(jù)服務標桿,才能在行業(yè)里實現(xiàn)良幣驅逐劣幣,真正讓人工智能成為新一輪技術革命的引擎。
五、面對未知:摸石頭過河的底層能力
對數(shù)據(jù)生產效率、數(shù)據(jù)質量保證和數(shù)據(jù)隱私安全的嚴格把控,幫助海天瑞聲在市場競爭中脫穎而出。
除了這些,還有一項異常重要的底層能力—與客戶一起摸著石頭過河、共同探索全新業(yè)務挑戰(zhàn)的實力與勇氣。
20 年前,人工智能商業(yè)落地還處在起步階段,真實場景下的泛化能力有限。
海天瑞聲歷經(jīng)數(shù)千個項目的打磨,服務全球 500 余家大型科技公司、頭部 AI 企業(yè)和科研院所,積累了大量行業(yè) Know-how,探索出幫助 AI 項目大幅縮短落地周期、降低成本的技術與方案能力,這也是其能夠探索 “未知” 領域的底氣所在。
就自動駕駛數(shù)據(jù)標注市場來說,當前大多數(shù)客戶的痛點之一在于如何實現(xiàn)駕駛中的數(shù)據(jù)閉環(huán),這些數(shù)據(jù)服務商的要求已經(jīng)遠遠超越了簡單的采集和標注能力,需要集技術、資金、經(jīng)驗等綜合實力于一體的數(shù)據(jù)服務商與客戶一起摸索、試錯。
如同蒸汽時代的蒸汽機、電氣時代的發(fā)電機、信息時代的計算機和互聯(lián)網(wǎng),人工智能正成為推動人類進入智能時代的決定性力量。
隨著人工智能邁入「數(shù)據(jù) + 知識」雙輪驅動的新一代,數(shù)據(jù)要素的市場地位被高度認同,市場空間廣闊。根據(jù)艾瑞、IDC 等第三方機構對 AI 訓練數(shù)據(jù)行業(yè)的研究,中國市場規(guī)模預計在 2025 年達到 100 + 億,全球訓練數(shù)據(jù)市場規(guī)模約在 500 億以上。
麥肯錫中國區(qū)數(shù)字化咨詢業(yè)務近期預測,未來幾年中國自動駕駛商業(yè)化會比預期更早來臨。
在邁向商業(yè)化的征途中,海天瑞聲會與企業(yè)共同摸索出加速模型訓練、產品落地和迭代更新的最佳路徑,更好地服務于未來社會。(作者:吳昕)
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )