降噪耳機在創(chuàng)造安靜的聆聽環(huán)境方面取得了長足進步,但如何讓用戶選擇性地聽到周圍特定聲音仍然是研究難題。例如,蘋果最新款的 AirPods Pro 可以根據(jù)環(huán)境自動調(diào)節(jié)音量 (例如,檢測到對話時),但用戶卻無法控制想聽誰說話以及何時啟用降噪功能。
華盛頓大學(xué)的研究團隊開發(fā)了一種人工智能系統(tǒng),可以讓用戶通過耳機注視某人說話 3-5 秒來「鎖定」他們的聲音。該系統(tǒng)名為「目標語音聆聽」(Target Speech Hearing),可以消除周圍所有其他噪音,并實時播放所鎖定說話人的聲音,即使聆聽者在嘈雜的環(huán)境中走動或不再面對說話人也能做到這一點。
研究團隊在 5 月 14 日于檀香山舉行的計算機-人類交互設(shè)計大會 (ACM CHI) 上展示了這項研究成果。他們還提供了該概念驗證設(shè)備的代碼,供其他人進行進一步開發(fā)。目前該系統(tǒng)尚未商用。
該論文的資深作者、華盛頓大學(xué)保羅·艾倫計算機科學(xué)與工程學(xué)院教授 Shyam Gollakota 表示:「我們現(xiàn)在通常認為人工智能是網(wǎng)絡(luò)聊天機器人,可以回答問題。但在這個項目中,我們開發(fā)的人工智能可以根據(jù)佩戴耳機者的偏好來改變他們的聽覺感知。使用我們的設(shè)備,即使您身處嘈雜的環(huán)境中,周圍有很多其他人聊天,您仍然可以清晰地聽到某一個人的聲音?!?/p>
要使用該系統(tǒng),佩戴普通耳機并配有麥克風(fēng)的用戶只需在轉(zhuǎn)頭看向目標說話人的同時輕按一個按鈕。來自該說話人聲音的聲波會同時到達耳機兩側(cè)的麥克風(fēng) (允許 16 度的誤差范圍)。耳機將信號發(fā)送到內(nèi)置的嵌入式計算機,團隊的機器學(xué)習(xí)軟件會在此學(xué)習(xí)目標說話人的語音模式。系統(tǒng)會鎖定該說話人的聲音,并持續(xù)播放給聆聽者,即使他們四處走動也不會中斷。隨著說話人繼續(xù)講話,系統(tǒng)將獲得更多訓(xùn)練數(shù)據(jù),其聚焦鎖定聲音的能力也會隨之提升。
研究團隊測試了該系統(tǒng),21 名參與者平均認為鎖定說話人的聲音清晰度是未經(jīng)濾波音頻的近兩倍。
這項工作基于該團隊之前「語義聆聽」的研究成果,該研究允許用戶選擇他們想要聽到的特定聲音類別 (例如鳥叫聲或人聲),并消除環(huán)境中的其他聲音。
目前,TSH 系統(tǒng)一次只能鎖定一個說話人,并且只能在目標說話人聲音的方向沒有其他大聲噪聲時進行鎖定。如果用戶對聲音質(zhì)量不滿意,可以再次對說話人進行鎖定以提高清晰度。
該團隊正致力于未來將該系統(tǒng)擴展到耳塞和助聽器上。
本文譯自 UW News,由 BALI 編輯發(fā)布。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )