擊敗微軟谷歌! 中國領(lǐng)軍企業(yè)曠視科技稱雄世界AI大賽

當(dāng)?shù)貢r間10月29日上午,在意大利威尼斯召開的計(jì)算機(jī)視覺國際頂級會議 International Conference on Computer Vision(ICCV 2017)的 “Joint COCO and Places Recognition Challenge” Workshop 中公布了 COCO 及 Places 競賽排名情況。中國領(lǐng)軍人工智能企業(yè)曠視科技Face++團(tuán)隊(duì)一舉擊敗了來自微軟、Facebook、Google、商湯科技等企業(yè),以及卡內(nèi)基梅隆大學(xué)、北京大學(xué)、香港中文大學(xué)、上海交通大學(xué)等高校的競爭者,拿下三項(xiàng)世界冠軍,成為了第一個在 COCO 競賽中獲得多項(xiàng)冠軍的中國企業(yè)。

據(jù)悉,在COCO、Places共七項(xiàng)的挑戰(zhàn)項(xiàng)目中,曠視科技研究院團(tuán)隊(duì)(Megvii)參與了四項(xiàng)挑戰(zhàn),并贏取了三項(xiàng)第一、一項(xiàng)第二的成績。

MS COCO (Microsoft Common Objects in Context,常見物體圖像識別) Challenge 是繼 ImageNet(已停辦)之后,計(jì)算機(jī)視覺領(lǐng)域最受關(guān)注和最權(quán)威的比賽之一,也目前是圖像(物體)識別方向的唯一標(biāo)桿,更是目前國際領(lǐng)域唯一一個能夠匯集 Google、Microsoft、Facebook 三大巨頭,國際頂尖院校以及優(yōu)秀創(chuàng)新企業(yè)共同參與的大賽。與關(guān)注整體圖像的 ImageNet 圖像分類任務(wù)相比,COCO 中的物體檢測任務(wù)更關(guān)注的是圖像中出現(xiàn)的每個物體的個體(比如各種小物體,各種遮擋物體),因此要求算法對圖像細(xì)節(jié)有更好的理解。這個比賽也代表了繼 ImageNet 后的圖像識別的最高水平。

圖:曠視科技Face++參賽團(tuán)隊(duì)

COCO 從2015年開始舉辦,至今已經(jīng)三屆,前兩屆物體檢測冠軍分別是 MSRA 和 Google。今年的 COCO 包含四個 Task:  Detection Challenge(物體檢測)、Instances segmentation(物體分割)、(Human) Keypoint Challenge(人體關(guān)鍵點(diǎn)檢測)、Stuff Segmentation(背景語義分割)。其中曠視科技Face++團(tuán)隊(duì)參與了前三項(xiàng)任務(wù)的挑戰(zhàn),并取得了兩項(xiàng)第一(物體檢測、人體關(guān)鍵點(diǎn)),一項(xiàng)第二(物體分割)的杰出成績。

圖:COCO Challenges Ranking Result

而 Places 是由 MIT 和 CMU 等高校牽頭,在今年新設(shè)立的一項(xiàng)旨在深度理解圖像場景的國際級計(jì)算機(jī)視覺類競賽,今年與 COCO 聯(lián)合舉行。Places 2017 共設(shè)有三個任務(wù):Scene Parsing(場景分割)、Instance Segmentation(物體分割)、Semantic Boundary Detection(邊緣檢測)。曠視科技Face++團(tuán)隊(duì)只參與了其中物體分割的挑戰(zhàn),并擊敗了主要競爭對手 Google,贏得了該任務(wù)的冠軍。

圖:曠視科技團(tuán)隊(duì)超過第二名Google 4.5個絕對百分點(diǎn)

而對于產(chǎn)業(yè)界來說,機(jī)器對于人體、物體和場景的理解十分重要。此次曠視研究院在 COCO  和 Places 競賽中的成績足以印證曠視科技在全球范圍內(nèi)的技術(shù)領(lǐng)先性。利用具有競爭力的技術(shù)優(yōu)勢,曠視研究院與產(chǎn)品中心將持續(xù)在產(chǎn)品開發(fā)中共同推進(jìn)技術(shù)轉(zhuǎn)化,展開行為識別、場景分割、物體檢測和物體分割等技術(shù)在互聯(lián)網(wǎng)金融、智能安防、城市大腦、新零售、手機(jī)等實(shí)用場景或行業(yè)中的應(yīng)用探索,以實(shí)現(xiàn)技術(shù)價值最大化。

曠視科技首席科學(xué)家、研究院院長孫劍表示,這次曠視科技能夠一舉在這個競爭最激烈的比賽中,第一次代表中國企業(yè)拿到分量最重的三項(xiàng)冠軍,主要依賴三個法寶:

1. 曠視擁有自研并全員使用的深度學(xué)習(xí)引擎 MegBrain,它使我們可以以最快的速度系統(tǒng)化訓(xùn)練算法;

2. 曠視研究院擁有對深度學(xué)習(xí)和計(jì)算機(jī)視覺算法長期而深入的研究積累。雖然曠視很少在國際數(shù)據(jù)集競賽上“刷榜”,但其實(shí)內(nèi)部的技術(shù)指標(biāo)一直都非常高,借這次機(jī)會拿出來和大家分享一下;

3. 曠視研究院除了擁有充沛的計(jì)算資源,更重要的是擁有一個鼓勵不斷高速創(chuàng)新的環(huán)境、和追求極致的文化。

“最后遙祝我們遠(yuǎn)在威尼斯的團(tuán)隊(duì),我為你們感到驕傲、為中國科技企業(yè)感到驕傲!”曠視科技首席科學(xué)家孫劍博士表示。此外,參與競賽的曠視研究員也在采訪時發(fā)表了自己的感想:“對于我來說,贏了是團(tuán)隊(duì)好輸了當(dāng)然是自己做得不夠好。這次比賽,我特別要介紹曠視研究院的Platform組。他們負(fù)責(zé)維護(hù)和建立上千塊GPU的集群,支持各種功能。而我們,動輒要求幾十上百塊GPU跨機(jī)訓(xùn)練,給他們造成了前所未有的壓力。但是,他們每次幾乎立即處理問題,并以最快的速度解決。這是我見過的最敬業(yè),效率最高的Team. 每一塊獎牌后面都應(yīng)該有他們的名字。”

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-10-30
擊敗微軟谷歌! 中國領(lǐng)軍企業(yè)曠視科技稱雄世界AI大賽
當(dāng)?shù)貢r間10月29日上午,在意大利威尼斯召開的計(jì)算機(jī)視覺國際頂級會議 International Conference on Computer Vision(ICCV 2017)的 “Joint COCO and Places Recognition Challenge” Workshop 中公布了 COCO 及 Places 競賽排名情況。中國領(lǐng)軍人工智能企業(yè)曠視科

長按掃碼 閱讀全文