全球化浪潮下的“溝通利器”:訊飛雙屏翻譯機(jī) 2.0用“耳朵+大腦”搭建“溝通橋梁”

在全球化進(jìn)程不斷加快的當(dāng)下,國(guó)際交流的場(chǎng)景早已從會(huì)議室里的安靜對(duì)話(huà),拓展到展會(huì)、工廠等復(fù)雜環(huán)境。隨之而來(lái)的,是跨語(yǔ)言溝通面臨的諸多現(xiàn)實(shí)挑戰(zhàn):嘈雜的環(huán)境、多人同時(shí)交談、聲源相互交織,讓傳統(tǒng)翻譯設(shè)備常常難以應(yīng)對(duì)。作為人工智能領(lǐng)域的“國(guó)家隊(duì)”,科大訊飛憑借著深厚技術(shù)積淀,創(chuàng)造性地給訊飛雙屏翻譯機(jī)2.0配備了“耳朵+大腦”,讓這款設(shè)備既聽(tīng)得清又會(huì)思考,為用戶(hù)帶來(lái)了全新的跨語(yǔ)種溝通體驗(yàn)。

首先,在聲音捕捉層面,訊飛雙屏翻譯機(jī) 2.0 配備了五顆高靈敏麥克風(fēng),它們以星型分布在設(shè)備的左右兩側(cè)與底部。這種獨(dú)特的陣列布局,如同為翻譯機(jī)打造了多個(gè)“敏銳的耳朵”,能夠從不同角度捕捉聲音。在復(fù)雜的聲場(chǎng)環(huán)境中,這些麥克風(fēng)協(xié)同工作,快速判斷哪個(gè)聲音離設(shè)備最近,哪個(gè)來(lái)自遠(yuǎn)方,為后續(xù)的“語(yǔ)音識(shí)別”筑牢根基。

全球化浪潮下的“溝通利器”:訊飛雙屏翻譯機(jī) 2.0用“耳朵+大腦”搭建“溝通橋梁”

有了精準(zhǔn)的聲音捕捉,接下來(lái)就是對(duì)聲音的“篩選過(guò)濾”。訊飛雙屏翻譯機(jī) 2.0引入深度強(qiáng)化學(xué)習(xí)技術(shù)和深度神經(jīng)網(wǎng)絡(luò),在嘈雜聲場(chǎng)中構(gòu)建了智能化的“聲學(xué)結(jié)界”。它會(huì)優(yōu)先處理 1 米以?xún)?nèi)的近場(chǎng)人聲,將其視為“主角”;而1米以外的環(huán)境音,則自動(dòng)被識(shí)別為“干擾配角”,算法會(huì)對(duì)其進(jìn)行削弱或?yàn)V除。這就好比在用戶(hù)和翻譯機(jī)之間拉起了一圈“隱形的聽(tīng)力護(hù)欄”,將外界的嘈雜聲音隔絕在外,讓關(guān)鍵語(yǔ)音清晰傳遞。

并且,訊飛雙屏翻譯機(jī) 2.0還引入了自適應(yīng)注意力機(jī)制,使算法模型進(jìn)一步具備了類(lèi)似人耳的“選擇性聚焦”能力,模擬人類(lèi)聽(tīng)覺(jué)注意力機(jī)制,在瞬間完成從“環(huán)境識(shí)別”到“目標(biāo)鎖定”的全過(guò)程,讓機(jī)器能夠精準(zhǔn)捕捉目標(biāo)語(yǔ)音,使訊飛雙屏翻譯機(jī) 2.0即便在多人交談、背景復(fù)雜的環(huán)境中,也能夠自動(dòng)聚焦對(duì)話(huà)對(duì)象,翻譯機(jī)等同于有了會(huì)思考的“大腦”。

“通過(guò)深度強(qiáng)化學(xué)習(xí)方法,目標(biāo)語(yǔ)音的STOI(語(yǔ)音可懂度)達(dá)到0.92,在工廠90dB機(jī)械轟鳴噪音、展會(huì)復(fù)雜背景人聲混雜場(chǎng)景,語(yǔ)音識(shí)別率從32.39%提升到98.69%,這個(gè)準(zhǔn)確率已經(jīng)接近了理論極限。”訊飛研究院聲學(xué)算法高級(jí)工程師程楓介紹道。

全球化浪潮下的“溝通利器”:訊飛雙屏翻譯機(jī) 2.0用“耳朵+大腦”搭建“溝通橋梁”

從會(huì)議室的精準(zhǔn)對(duì)譯到展會(huì)現(xiàn)場(chǎng)的嘈雜交涉,從工廠機(jī)械的轟鳴背景到機(jī)場(chǎng)人流的多音交織,當(dāng)全球化浪潮推動(dòng)著人類(lèi)交流走向更復(fù)雜的場(chǎng)景,訊飛雙屏翻譯機(jī) 2.0憑借“耳朵 + 大腦”的創(chuàng)新架構(gòu),真正實(shí)現(xiàn)了從“能翻譯”到“會(huì)溝通”的跨越。

正如科大訊飛翻譯業(yè)務(wù)線(xiàn)產(chǎn)品總監(jiān)孫境廷所言,“從技術(shù)中來(lái),到用戶(hù)中去,技術(shù)創(chuàng)新優(yōu)化用戶(hù)體驗(yàn)”,訊飛雙屏翻譯機(jī)2.0通過(guò)最前沿的強(qiáng)降噪技術(shù),讓跨國(guó)交流不再受困于語(yǔ)音識(shí)別的模糊地帶,為全球用戶(hù)打開(kāi)了更廣闊的溝通空間。未來(lái)隨著人工智能與聲學(xué)技術(shù)的進(jìn)一步融合,科大訊飛將持續(xù)以技術(shù)創(chuàng)新助力實(shí)現(xiàn)“聲動(dòng)世界 智聯(lián)未來(lái)”的愿景。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )