国产内射视频在线手机观看,在线观看天堂网亚洲av,亚洲高清免费视频

谷歌語音識別Google Now

導語：彭博社今天撰文稱，谷歌正在語音識別領(lǐng)域展開野心勃勃的嘗試，希望通過技術(shù)手段實現(xiàn)超越人類的語音識別能力。

以下為文章全文：

與數(shù)字助理交流是一件有趣的事情，它給人的感覺就像固執(zhí)的孩童。如果你曾經(jīng)對著Xbox或Siri大喊大叫，你或許已經(jīng)失去希望。

但研究人員表示，語音識別和人工智能領(lǐng)域最近取得的突破，很快就能大幅提升這些電子產(chǎn)品的理解力，使之更好地與我們展開溝通。谷歌工程師約翰·沙爾克維克(Johan Schalkwyk)表示，這種全新的設備不僅能聽懂我們的意思，還能結(jié)合上下文和語調(diào)的細微差別理解深層含義。

沙爾克維克正在谷歌從事一項野心勃勃的研究項目，希望創(chuàng)造一套能夠利用該公司海量數(shù)據(jù)的語音系統(tǒng)。他表示，他們目前正在實驗室里測試的一個項目，使得電腦可以聽懂并“思考”人們的語言。

最近在語音識別和機器學習領(lǐng)域的各種發(fā)明，將給語音識別帶來巨大變化。Siri的一位主要發(fā)明人表示，工程師都在狂熱地開發(fā)語音識別技術(shù)，使之具備足夠的智能，與用戶展開真正的對話。“語音識別的所有領(lǐng)域都已經(jīng)實現(xiàn)了很大進步。”Siri底層技術(shù)開發(fā)公司SRI International副總裁威廉·馬克(William Mark)說，“這種對話互動目前已經(jīng)成為前沿技術(shù)。”

蒂姆·圖塔爾(Tim Tuttle)等待這一天已經(jīng)很久了。他1997年獲得了麻省理工學院的博士學位，并任職于該校的人工智能實驗室。10年來，他先后在硅谷多家公司任職，最終于2010年創(chuàng)辦了自己的Except Labs公司。圖塔爾的公司去年開始設計一套系統(tǒng)，向移動應用中增加復雜的語音指令。例如，當用戶走進超市時，可以通過這項功能獲知他要買的掃帚位于哪條走廊。

“一年前，我們在做基準，我們當時認為這不可能實現(xiàn)。但一切都變了。我們的公司已經(jīng)對語音加倍下注，主要是因為近期所看到的各種技術(shù)進步。”圖塔爾說，“與人類水平相當或高于人類水平的語音識別系統(tǒng)將實現(xiàn)商業(yè)化。”

但首先，還是先來回顧一下歷史：兩年半以前，谷歌和多倫多大學的研究人員發(fā)表了一篇頗有影響力的論文，內(nèi)容是用“深度神經(jīng)網(wǎng)絡”來指導計算機語音技術(shù)。幾個月后，微軟與IBM也合作發(fā)表了另外一篇論文，被谷歌工程師杰夫·迪恩(Jeff Dean)稱作“語音研究領(lǐng)域20年來的最大進步”。

這些研究使得一項數(shù)十年前誕生的數(shù)字神經(jīng)網(wǎng)絡發(fā)明再度復活。這項技術(shù)1980年代就在大數(shù)據(jù)預測和分析領(lǐng)域?qū)崿F(xiàn)了不俗的表現(xiàn)，但當時卻受到計算機速度的制約。神經(jīng)網(wǎng)絡直到最近才變成可行的方案，這主要得益于計算機處理速度的加快，以及新型軟件模式的發(fā)展。

谷歌實驗室也開展了類似的研究。6個月前，該團隊從這種名為“前饋神經(jīng)網(wǎng)絡”的古老方法入手，推動了神經(jīng)網(wǎng)絡技術(shù)的復活。這項技術(shù)使得系統(tǒng)可以儲存更多信息，并處理更長、更復雜的序列。谷歌這項突破源自對底層代碼的簡化，可以在同一套系統(tǒng)中保留更多觀點和觀念，從而讓用戶更容易問出復雜的問題，獲得有意義的答案。“系統(tǒng)復雜性可能對長期發(fā)展構(gòu)成傷害。”沙爾克維克說。

谷歌的系統(tǒng)目前使用上下文、物理位置和其他因素進行假設，以此判斷語音的真正含義——整個過程與人類大腦的思維模式相仿。谷歌的最新網(wǎng)絡技術(shù)可以提升這一過程的效率，從而處理比以往更大的數(shù)據(jù)量，回答更復雜的問題。

為了解釋語音識別技術(shù)在未來的工作方式，沙爾克維克提到了谷歌山景城總部幾公里之外的一間高級越南餐廳。這家名為Xanh Restaurant的餐廳對典型的語音識別構(gòu)成了挑戰(zhàn)，因為Xanh這個名字(發(fā)音為“扎恩”)很難識別。“如果我能找到它在地圖上的位置，然后說，‘這是一家餐館，它位于加州。’那么范圍就會立刻縮小。”沙爾克維克說，“借助語義技術(shù)，我們便可大幅改善質(zhì)量。”

這聽起來似乎很簡單，但對電腦來說，聽到一個單詞，然后把它放到句子上下文中去辨識，再與地理信息相結(jié)合，是十分困難而且耗費時間的。如今，谷歌語音搜索已經(jīng)可以正確識別餐館。沙爾克維克表示，谷歌今后將可以處理其他一些同樣野心勃勃的問題。

沙爾克維克表示，在谷歌內(nèi)部，語音識別技術(shù)已經(jīng)實現(xiàn)了空前的進步。雖然谷歌的重大進步還要再等一兩年才能應用到用戶的手機中，但這個項目已經(jīng)催生了很多可以應用于谷歌其他項目的技術(shù)。“開發(fā)登月項目的同時，還會同時設計出另外一百項有用的技術(shù)。”沙爾克維克說。

沙爾克維克表示，谷歌語音識別技術(shù)3年前只能認出3/4的口語單詞。但得益于創(chuàng)新速度的加快，谷歌手機應用現(xiàn)在可以正確識別12/13的單詞。據(jù)圖塔爾介紹，要不了多久，“我們就將生活在一個沒有鍵盤的世界里。”(鼎宏)

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

谷歌語音識別想超過人類，方法是借助神經(jīng)網(wǎng)絡

下一篇

谷歌語音識別想超過人類，方法是借助神經(jīng)網(wǎng)絡

下一篇

谷歌語音識別想超過人類，方法是借助神經(jīng)網(wǎng)絡