近期,捷通華聲應用最新算法,推出全新一代靈云語音識別核心引擎,識別率實現跨越式提升。目前,新一代語音識別技術已上線靈云平臺(AIcloud.com),供開發(fā)者調用,并面向政企客戶推出包含8k、16k版本的全新靈云語音識別能力平臺。
新一代靈云語音識別演示(建議全屏觀看)
此次靈云語音識別技術的升級,是捷通華聲在CTC算法的基礎上,對建模單元粗粒度、模型訓練方法、解碼幀率進行創(chuàng)新優(yōu)化。有效提升了語音識別引擎的執(zhí)行效率、魯棒性,增強了口音、語速適配能力,大幅提升了多人對講、遠場講話等場景中的語音識別率。
調用云端語音識別服務 就上靈云平臺
新一代靈云語音識別技術已上線靈云平臺,開發(fā)者可以去靈云開發(fā)者社區(qū)申請調用。
開發(fā)者將靈云語音識別SDK集成到ISO、JAVA、安卓、Windows等軟件應用中后,填寫申請到的靈云平臺語音識別服務地址、授權信息,便可免費調用靈云平臺的語音識別服務。
目前,靈云平臺上的語音識別技術已服務包括打車軟件、輸入法、翻譯APP、手機銀行客戶端等各類數十萬應用,覆蓋數億終端用戶。
靈云ASR能力平臺 為政企單位提供私有、專業(yè)的語音識別能力
在提供公有云ASR能力的同時,捷通華聲一直在為Callcenter、會議、公安等場景提供私有化的語音識別能力。
其中,在Callcenter 電話信道8K語音識別場景,捷通華聲已服務眾多大型銀行客服中心、客服BPO中心,將海量語音實時轉寫為文字,為智能質檢、智能客服、智能外呼、數據分析等提供私有云的語音識別能力。
在會議、司法、醫(yī)療等16k語音識別場景,捷通華聲積累了大量聲學、語言數據,分別推出了會議、審訊、醫(yī)療各科室等行業(yè)版的語音識別能力平臺,為政企客戶提供專業(yè)、私有、更安全的語音識別能力。
十多年來,捷通華聲始終堅持核心技術自主研發(fā)。隨著此次靈云語音識別技術的跨越式提升,捷通華聲將為公有云開發(fā)者、政企客戶提供識別率更高、更優(yōu)質的語音識別能力與服務。
- 魏建軍五一假期試駕全新高山:第三排也能當老板位,上市倒計時!
- 英偉達RTX PRO 6000顯卡現身Geekbench,顛覆性能震撼來襲,CUDA核心爆表,ECC顯存領先業(yè)界
- 工信部發(fā)力工業(yè)領域數據集建設,打造通用大模型與行業(yè)大模型新篇章
- 特斯拉:顛覆傳統(tǒng)視覺處理方案,打造人人都能擁有的智能駕駛未來
- 新能源車市場崛起:中國占全球份額超六成,增量貢獻度達八成
- 蘋果CEO庫克致敬巴菲特:一生之幸,得與股神共事
- 微軟必應逆襲成功,市場份額升至12.2%,谷歌地位受挑戰(zhàn)降至79.1%。
- 股神巴菲特宣布年底告別江湖,接班人揭秘:神秘投資者露面
- 抖音回應于東來“退圈”事件:下架侵權視頻,維護版權新風向
- 蘋果因關稅政策額外增加9億美元成本,庫克回應:挑戰(zhàn)升級
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。