從歲月飛向未來:京東AI的國慶跨欄

國慶長假,看閱兵自然是重頭戲。而在另一個舞臺上,科技公司的“閱兵”也在如火如荼上演著。

各大媒體與科技公司合作,進行國慶獻禮的方式,主要是與國慶熱點以各種方式結合,在融媒體渠道進行創(chuàng)意傳播。而在這場傳播熱浪中,AI技術則變成了當之無愧的主角。在各家紛紛亮出自己的AI+國慶創(chuàng)意后,我們也可以借由這個機會,審視不同企業(yè)對AI技術的差異化理解與應用。

比如說,京東牽手《人民日報》,在國慶檔帶來了一個名為“70年,我是主角”的創(chuàng)意H5。這個H5采用了目前火熱的AI換臉技術。用戶只需要輸入照片,就可以隨機生成6段微視頻。這些視頻是共和國誕生至今的一系列大事件。借由AI,用戶可以穿過歲月,回到歷史抉擇的舞臺中央,發(fā)現(xiàn)自己與共和國休戚與共的因緣瞬間,感受祖國70年的宏偉變遷。

在H5的創(chuàng)意和內容之外,我們還會發(fā)現(xiàn),用AI技術完成的“跨時空光影”,背后是一系列機器視覺技術的躍遷與突破。這些技術已經(jīng)系統(tǒng)性、大規(guī)模、全流程地部署在京東的零售、市政服務、融媒體等場景中,變成共和國真正的生產(chǎn)力。

或許我們可以把這個H5以及背后代表的京東AI技術、AI戰(zhàn)略想象為一次跨欄。從起跳到落地,這背后還能讀出更多關于京東AI的故事。

起跳:從京東AI戰(zhàn)略到“跨越時空”

提到越來越火熱的AI技術,或許每個人都會想起一些相關的公司。但可能很少有人會第一時間想到京東。把京東和AI聯(lián)系到一起時,我們可能也更多會想到京東APP中的一些AI應用,以及物流領域的AI加持。

但如果我們品味一下“70年,我是主角”所展現(xiàn)出的AI技術,會發(fā)現(xiàn)它指向著機器視覺的深度應用與高可用性。一次生成6段視頻的特征,一張圖片數(shù)據(jù)匹配大量視頻資源的深度交互模式,以及國慶熱點中海量并發(fā)數(shù)據(jù)的處理,都讓這份國慶獻禮顯示出莊重與激昂。

把邏輯倒回一點,如果我們將這次H5視作一次跨欄,那么,起跳其實是京東持續(xù)積累的AI戰(zhàn)略與AI技術能力。事實上,京東已經(jīng)在AI之路上,投注了相當可觀的時間與資源。

2018年4月,京東發(fā)布了AI開放平臺NeuHub。NeuHub的特色,是基于京東豐富的場景和海量數(shù)據(jù),在實際應用中發(fā)展而出的,面向零售與零售基礎設施領域的AI開放平臺。

目前,NeuHub平臺包含開發(fā)平臺、應用平臺和創(chuàng)新應用,以平臺級的服務鏈接人工智能的供需兩側,提供能力、工具、SaaS等一站式人工智能服務和應用,以及面向不同場景的端到端集成創(chuàng)新產(chǎn)品和解決方案,以多層次的人工智能產(chǎn)品和應用,滿足多維度人工智能需求。

依托于NeuHub對數(shù)據(jù)、算法,以及應用場景的結合,京東踏出了以業(yè)務場景為軸心的AI之路。2019年8月,在上海2019 WAIC世界人工智能大會開幕式上,科技部公布了最新一批國家人工智能開放創(chuàng)新平臺名單,宣布依托京東集團建設智能供應鏈國家新一代人工智能開放創(chuàng)新平臺,領銜智能供應鏈國家戰(zhàn)略發(fā)展。入選“國家隊”的京東,確定了NeuHub為核心載體,零售、物流、供應鏈為廣泛應用場景,依托京東零售、物流、金融、云計算、IoT、大數(shù)據(jù)等能力和資源,全面向業(yè)界開放的AI戰(zhàn)略體系。

京東集團副總裁、京東人工智能事業(yè)部總裁、京東人工智能研究院院長周伯文博士認為,京東智能供應鏈國家新一代人工智能開放創(chuàng)新平臺將從基礎資源、能力支撐、應用生態(tài)三個層面進行平臺架構設計,形成“三三三”總體框架和任務。

即夯實算力、數(shù)據(jù)、算法三大基礎資源;集成京東開發(fā)經(jīng)驗和開發(fā)組件、京東AI算法庫及定制化模型工具三大核心能力;平臺從工具、服務和組件三個方面,在智能生產(chǎn)、智能流通、智能消費三大應用場景支持和構建生態(tài)。

從夯實平臺基礎能力做起,面向零售產(chǎn)業(yè)與供應鏈實際場景提供可用性服務,強調技術與工具、服務的融合。這些特點構筑了京東AI的三大差異化特征。而這些特征,某種程度上非常生動的展現(xiàn)于這次“跨越時空”的H5當中。

厚積薄發(fā)的京東人工智能,決定在國慶舞臺上展示一下身手。

空中:視頻換臉技術的三層飛躍

讓我們回到“70年,我是主角”的傳播創(chuàng)意當中。

事實上,如今AI換臉類的玩法大多數(shù)讀者已經(jīng)并不陌生。視頻換臉雖然火熱,但最初的驚奇顯然已經(jīng)過去。然而正是在這樣的時刻,我們可以更準備品讀出換臉技術背后的差異化優(yōu)勢,從而透視技術提供者的產(chǎn)業(yè)供給能力。

從京東AI戰(zhàn)略的起跳點出發(fā),可以看到這次H5本身在技術上實現(xiàn)了3層技術跨越。這些技術應用帶給了我們獨特的國慶慶祝方式,也帶我們看到了未來京東將要輸出給產(chǎn)業(yè)的AI技術特征:

1、跨越運動:人臉檢測算法ISRN

這次H5的一大特征,就是生成的電影片段里有大量奔跑鏡頭和頻繁的姿態(tài)變化。我們知道,一般視頻變臉模型,是很難處理快節(jié)奏運動的,高頻運動基本意味著丟幀和算法捕捉失靈。

為了解決這個問題,讓用戶真正體會在歷史大事件中奔跑的感覺,京東AI提出了全新的人臉檢測算法“Improved Selective Refinement Network(ISRN)”。

ISRN在業(yè)界頂級人臉檢測榜單“WIDER FACE”中的“Easy”、“Medium”和“Hard”三項評測集中,以96.3%AP,95.4%AP,90.3%AP的優(yōu)異性能全部獲得排名第一。在遠景、動態(tài)以及快速姿態(tài)變化中保證了AI依舊能夠高效準確工作。

2、跨越空間:人臉3d關鍵點檢測

AI換臉的另一個關鍵問題在于,人臉是會進行空間運動的。也就是側臉、轉動頭部、低頭抬頭等動作,都會讓人臉識別和替換的空間關系發(fā)生變化。這經(jīng)常會導致瞬時的模型失靈,降低視頻換臉的體驗。為了應對空間障礙,京東利用3D關鍵點檢測技術,定位了人臉區(qū)域的5萬多個關鍵點,并基于這些關鍵點對人臉進行重構。這一努力是這次“跨越時空”得以實現(xiàn)的關鍵。

由于3D數(shù)據(jù)難以獲取且很難修正,京東提出了一種基于2D關鍵點輔助的3D關鍵點檢測方法,性能超越了當前業(yè)界主流3D關鍵點檢測算法,這使得完全側臉的數(shù)據(jù)也可以準確進行3D檢測。

3、跨越光影:紋理圖像的融合處理

在視頻換臉中,還有一個難點就是對光線的處理。由于電影中的光線明暗變化非常復雜,這給換臉的自然度帶來了非常大的挑戰(zhàn),尤其是人臉關鍵點檢測將非常困難。面對這樣的問題,京東AI采用了在紋理圖上進行融合處理的方式,使紋理生成獨立于頭部姿態(tài)變化,增強了換臉效果的魯棒性,讓用戶的面孔,和時代的光影融合為一。

這三層跨越,可以總結為這樣一個技術特征:在復雜場景中應用,與現(xiàn)實視頻數(shù)據(jù)深度耦合的人臉識別與圖像處理能力。藏在一個H5背后的三個飛躍,體現(xiàn)出了京東AI技術在商業(yè)落地方面的廣闊可能。

落地:新商業(yè),新AI

跨越技術難題,挑戰(zhàn)極速準確電影換臉的京東AI,實際上正在廣泛完成從AI起跳、技術飛躍,到商業(yè)落地的三部曲進化。

讓我們回想一下前文講述的三層技術跨越,不難發(fā)現(xiàn)這三個挑戰(zhàn),都是現(xiàn)實場景中人臉識別與圖像處理工作里普遍面臨的難題。比如零售場景中,要應對大量側臉和低頭的識別情況;安防場景中,快速運動其實是最需要準確識別的場景,但往往會成為困擾AI的難題。

如果把“70年,我是主角”視為一次技術閱兵。那么其背后展現(xiàn)出的,實際上是京東AI在人臉識別、視頻分析與圖像處理能力在現(xiàn)實場景中的深層應用。人臉識別與精準處理,將可以快速動態(tài)在復雜、高速、多角度的視頻當中發(fā)揮識別和處理功能,這就將單一平面化的人臉技術,提升到了現(xiàn)實中的人臉識別+多元處理紀元。

把實驗中看上去不錯的懸空AI,變?yōu)榈浆F(xiàn)實場景中的實戰(zhàn)AI,這是京東AI的核心特征。事實上,H5中應用的機器視覺技術,已經(jīng)廣泛應用于京東在零售、安防等領域的產(chǎn)業(yè)布局。

比如在零售領域,京東AI的視聯(lián)網(wǎng)各項產(chǎn)品中已經(jīng)廣泛應用人臉相關技術來提升用戶體驗和服務效率,比如增進拍照購精準度,在京東門店體系中進行人流與分析,在物流體系中進行配送分揀行為識別等等。

而在安防領域,京東AI的人臉技術已經(jīng)與公共安全、交通城市、智能樓宇等場景廣泛結合,形成了京東新的產(chǎn)業(yè)合作空間。

深度技術融合、面向現(xiàn)實問題、安全可信賴,這些關鍵詞構成了京東AI的戰(zhàn)略結構。“70年,我是主角”中,真正的主角其實是AI技術系統(tǒng)性、大規(guī)模、全流程的商業(yè)落地。這一通道,正在為京東和產(chǎn)業(yè)智能化的未來提供一個全新舞臺。

新商業(yè),新AI,京東正在觸發(fā)一段新的科技旅程。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-10-01
從歲月飛向未來:京東AI的國慶跨欄
在H5的創(chuàng)意和內容之外,我們還會發(fā)現(xiàn),用AI技術完成的“跨時空光影”,背后是一系列機器視覺技術的躍遷與突破。

長按掃碼 閱讀全文