上周,谷歌將Google Assistant下放到Android 6.0,而蘋果的Siri、微軟的Cortana、亞馬遜的Alexa最近也動作頻頻,一場圍繞下智能語音助手的大戰(zhàn)正在全面展開。
西雅圖艾倫人工智能研究所CEO Oren Etzioni表示,Siri作為最早入場的選手,其語音理解和回答問題的能力并不突出,白白浪費了先發(fā)優(yōu)勢。
但Siri并不是一無是處,它仍然有其他語音助手目前無法匹敵的優(yōu)勢:支持36個國家的21種本地語言。由于大多數(shù)的智能手機都是在非英語國家銷售,對本地語言的支持將是非常重要的一個能力。
相比之下,微軟的Cortana能夠識別13個國家的8種語言,Google Aissitant則支持4種語言,而亞馬遜的Alexa目前只支持英語和德語。
但是Siri并沒有停下,據(jù)外媒報道,iOS 10.3即將支持上海話。
如果語音助手想要成為智能手機和其他智能設備標配的工具,那么語言問題將是其必須克服的障礙。但是語言本身對任何助手來說都是復雜的。比如在英國,當談論足球比分時,“2:0”要說成“two-nil”,而不是“two-nothing”。
蘋果語音團隊負責人Alex Acero在接受路透社采訪時解釋了如何教Siri學習一門全新的語言。
Alex Acero說,在蘋果公司,當研究人員開始教Siri一門新的語言時,會讓真人用各種方言和口音來閱讀文本段落,然后由聽譯人員轉錄成文本,這樣計算機就可以擁有準確的樣本用來練習。此外,蘋果還會從不同的聲音中捕捉各種語音。然后,蘋果會建立起一個聲學模型,并通過這個模型開始嘗試預測字符序列。
Acero稱,蘋果隨后會在新語言中部署“聽寫模式”,這是一種文本和語音之間的翻譯器。當用戶使用聽寫模式時,蘋果會捕獲音頻錄音中的一小部分,然后對其匿名處理。由于這些錄音有背景噪音以及模糊不清的詞語,將會由專人轉錄,這一過程可以將語音識別的錯誤率降低一半。
在收集了足夠的數(shù)據(jù),并讓配音演員為新語言錄制了聲音之后,蘋果就會向公眾開放這一語言版本的Siri。不過,發(fā)布之初Siri只能回答蘋果認為最常見的問題。發(fā)布之后,Siri將會從用戶的實際問題中學習,并且會每兩周更新一次,作出一些調整。
不過,智能助理Ozlo的創(chuàng)始人Chales Jolley表示,為語音助手撰寫腳本無法做到規(guī)?;?ldquo;你不可能聘請足夠多的作者為每一種語言撰寫需要的腳本,你必須將答案綜合起來。“他認為,這還需要多年的時間。
三星去年收購了“Siri之父”創(chuàng)建的人工智能公司Viv Labs,這家初創(chuàng)公司就正在著手解決這個問題。Viv的聯(lián)合創(chuàng)始人兼CEO Dag Kittlaus說:“Viv旨在專門解決智能助理的規(guī)?;瘑栴},要想跨過目前版本的功能局限,唯一的方法就是開放系統(tǒng),讓世界來教它們。“
- 企業(yè)數(shù)量5年暴增超190倍,江蘇東??h成全球穿戴甲核心產區(qū)
- AI CITY@城市智能體生態(tài)聯(lián)盟發(fā)起成立,智慧城市建設進入Agent時代!
- 英特爾第一季度營收127億美元,同比持平
- 國內首個!百度宣布點亮昆侖芯3萬卡集群
- 第三屆百度“文心杯”創(chuàng)業(yè)大賽啟動 最高獎金達7000萬元
- 百度發(fā)布全球首個電商交易MCP、搜索MCP,幫助開發(fā)者全面擁抱MCP
- 百度發(fā)布百度搜索開放平臺·AI開放計劃,開放接入各類AI應用,賦能應用開發(fā)者
- 百度發(fā)布多智能體協(xié)作應用「心響」,一句話解決復雜任務
- 內容操作系統(tǒng)“滄舟OS”發(fā)布!百度文庫AI月活用戶近1億
- 百度發(fā)布高說服力數(shù)字人:劇本生成、多模驅動 僅需錄制2分鐘!
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。