站在5G的視角上,百度AI+視頻確實大有可為

今年年初的時候,華為和沃達豐完成了首次5G通話測試,并成功實現(xiàn)了實時高清視頻通話。遺憾的是,這一標(biāo)志性的事件并沒有在輿論中形成話題效應(yīng),大多數(shù)人對于5G的認(rèn)知仍然停留在概念層面。

以至于當(dāng)百度高級副總裁、百度搜索公司總裁向海龍在今年的百度聯(lián)盟生態(tài)峰會上提出 “擁抱視頻時代”的時候,部分媒體并沒有完全理解其中深意,將其指出的“視頻時代”與時下正在風(fēng)口上的短視頻畫上了等號。短視頻的火爆可以算是即將到來的“視頻時代”的信號,但也僅僅是“視頻時代”的冰山一角而已,且百度的野心也遠不止于此。

問題的根源,還是要回到5G這個被視為下一代移動通信網(wǎng)絡(luò)的視角上。

信息載體的迭代:文字、圖片、視頻

技術(shù)迭代的節(jié)奏約束了人們的想象力,也左右了大多數(shù)人的認(rèn)知。好比說已經(jīng)普及的4G通信技術(shù),給人的直觀印象是“快”,導(dǎo)致我們對于5G的理解就是網(wǎng)速更快。其實從信息載體迭代的角度,更容易跨過技術(shù)迭代所帶來的認(rèn)知鴻溝。

先從1G時代說起,“大哥大”一度象征著財富和地位,只是很多人對這個時代都過于陌生,所知所感所想無不來自于電影片段里。1G技術(shù)的價值,無非是把必須連著線的固定電話,在功能上變成了比磚頭還要笨重的“大哥大”。

2G時代是手機連接互聯(lián)網(wǎng)的開始,準(zhǔn)確地說是讓大家“嘗鮮”,在一寸見方的屏幕上瀏覽新聞、郵件等,文字幾乎是唯一的信息載體,應(yīng)用場景自然比較局限,就連IM通訊也未能進化到語音溝通。

3G時代的手機開始成為名符其實的互聯(lián)網(wǎng)終端,3G網(wǎng)絡(luò)能夠處理圖像、音樂、流媒體等多種信息形式,諸如電商、游戲等五花八門的產(chǎn)品應(yīng)用應(yīng)運而生。不過對于經(jīng)歷過那個時代的老網(wǎng)民而言,最深刻的印象還是圖片作為信息載體的流行,畢竟網(wǎng)速那么慢,游戲、視頻的體驗難言差強人意。

如果說3G打破了互聯(lián)網(wǎng)的門檻,邁入4G時代之后看到的是互聯(lián)網(wǎng)應(yīng)用的繁榮,即時通訊、電商、移動支付、在線游戲、直播、短視頻等等。一言以蔽之,4G時代已經(jīng)有了視頻作為信息載體的趨勢,只是受限于帶寬、可靠性、時延等因素,直播、短視頻成為4G時代的幸運兒,實時高清視頻、遠程交互等還需要5G來解決。

理清了這個邏輯,再來看向海龍對視頻時代的預(yù)言,興許就不至于有那么大的誤解。向海龍站在5G的視角上,預(yù)言人們的溝通方式將進入視頻時代,人與人之間的溝通不再需要文字、圖片等作為媒介,而是回歸到“指手畫腳的原始時代”,原因在于實時高清視頻等讓人們的溝通擺脫了時間和空間的限制。

作為旁觀者的大多數(shù)人,仍然從4G的視角上理解百度的新動作,觀點自然有些偏頗。同時向海龍觀點的前瞻性卻在資本層面得到了印證,流媒體公司Netflix的市值達到1536億美金,正式超過傳媒巨頭迪士尼,出發(fā)點正是5G給予視頻產(chǎn)業(yè)的機遇。

互聯(lián)網(wǎng)+到AI+,視頻成為百度AI的新場景

回到百度的問題上,一面是前景誘人的5G,一面是百度主張的AI戰(zhàn)略,二者沖突嗎?答案顯然是否定的。

同樣是在2016年的百度聯(lián)盟峰會上,李彥宏發(fā)表了題為“下一幕:人工智能”的演講下如果說互聯(lián)網(wǎng)的第一幕是PC互聯(lián)網(wǎng),這一幕是移動互聯(lián)網(wǎng),而移動互聯(lián)網(wǎng)的紅利期已經(jīng)基本結(jié)束,那么下一幕是什么?李彥宏給出的答案是人工智能

前幾年比較流行的說法是“互聯(lián)網(wǎng)+”,其實百度的策略已經(jīng)是“AI+”。在出行場景上,百度的應(yīng)對之策是AI+汽車的Apollo;在居家場景上,百度打造了AI+硬件的DuerOS;在理財場景上,百度推出了AI+金融的度小滿……而在內(nèi)容消費場景上,百度已經(jīng)打造了千人千面智能化推薦的信息流,在5G視頻時代來臨之際無疑將是AI+視頻。

為何在4G和WiFi看起來已經(jīng)普及的背景下,視頻仍然只是文字、圖片等信息傳遞方式的補充?向海龍歸結(jié)了視頻應(yīng)用的四個難點:生產(chǎn)難——視頻生產(chǎn)需要專業(yè)設(shè)備;存儲難——需要很大的存儲空間;傳輸難——傳輸速度慢和流量資費貴使得傳輸成本高;檢索難——基于語義理解和字面匹配的傳統(tǒng)檢索技術(shù)難以在視頻這種信息載體上直接應(yīng)用。

折射到現(xiàn)實中來看,直播就是一個典型案例。受限于生產(chǎn)環(huán)節(jié)的痛點,大多數(shù)主播能做的只是改變背景布置,對于存儲、傳輸上的尷尬,當(dāng)前直播APP的清晰度清一色的AV畫質(zhì),并且有著10秒左右的延時。

“擁抱視頻時代”并非只是一個口號,在內(nèi)容場景上有著充足經(jīng)驗的百度,正著手從AI的角度解決兩個問題:一個是內(nèi)容生產(chǎn),另一個是內(nèi)容檢索。

比如要拍攝高質(zhì)量的視頻內(nèi)容,特效是不可或缺,這也是國產(chǎn)電影和好萊塢大片最為明顯的差別。百度的解決方案是通過AI的賦能讓視頻生產(chǎn)簡單化,利用百度AI的人體識別、形體美化、人景分離、語音識別、語音合成等能力,可以實現(xiàn)“瘦身”、“分身術(shù)”、“變身”等特效,為復(fù)雜視頻生產(chǎn)的簡單化提供了新出路。

更令人頭疼的還是視頻的檢索,當(dāng)前流行的解決方案是人為給視頻打標(biāo)簽或者添加文字描述,與智能化的目標(biāo)相差甚遠。百度的解決之道同樣是AI,通過對視頻的全景掃描,利用語音識別、人臉識別、物體識別等技術(shù)完整分析視頻中的內(nèi)容,將視頻背景、人物、語言等信息進行組合,可以給每個視頻生成一個獨特的“指紋”,大幅提升視頻檢索的效率和準(zhǔn)確率。

雖然百度并未明確提及,但顯而易見的是,當(dāng)視頻的“指紋”被生成,配合百度基于大數(shù)據(jù)建立的用戶畫像,視頻的分發(fā)將會前所未有的更加精準(zhǔn)和智能。

可以預(yù)見的是,百度的AI技術(shù)以及5G時代的來臨,解決了內(nèi)容生產(chǎn)、檢索和分發(fā)的問題,視頻作為主流信息載體已然在意料之中。

寫在最后

在未來面前,人類永遠都是個孩子。

至少百度讓我們看到了這樣的前景,5G時代視頻的應(yīng)用將是顛覆性的:讓精密手術(shù)的遠程操作成為可能,盡可能地解決醫(yī)療資源的不平衡;躺在家里也能隨時學(xué)習(xí)高端教育課程,打破時間和空間的限制;和朋友的交流不再是枯燥的文字和斗圖,而是“面對面”的視頻溝通;以及習(xí)慣于用高清視頻來記錄生活……

其實百度的“新視代”也很簡單:只要哼唱一兩句歌曲,百度就能幫你檢索出這首歌的MV;只要用手機掃一下臉,就能找到一段視頻中所有關(guān)于你的片段;當(dāng)你偶爾在網(wǎng)上看到一段小視頻,即刻就能找到視頻的完整版;不一而足。

或許到了三五年后,再來回頭審視百度當(dāng)前的戰(zhàn)略布局和技術(shù)探索,已經(jīng)不會再有質(zhì)疑和不解,取而代之的是清一色的掌聲。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-06-01
站在5G的視角上,百度AI+視頻確實大有可為
今年年初的時候,華為和沃達豐完成了首次5G通話測試,并成功實現(xiàn)了實時高清視頻通話。遺憾的是,這一標(biāo)志性的事件并沒有在輿論中形成話題效應(yīng),大多數(shù)人對于5G的認(rèn)知仍然停留在概念層面。

長按掃碼 閱讀全文