原標(biāo)題:AI技術(shù)再次升級,新技術(shù)、更豐富的平臺你了解多少?
7月3日~4日,一年一度的百度AI開發(fā)者大會在京舉行。承載AI to B發(fā)展的智能云業(yè)務(wù),以豐富多彩的落地案例和一站式的開發(fā)者服務(wù)深受企業(yè)、機(jī)構(gòu)、開發(fā)者的關(guān)注和垂詢。百度智能云除了基礎(chǔ)服務(wù)保障,在AI服務(wù)方向,更是助力企業(yè)創(chuàng)新發(fā)展。本月,我們將打磨和升級的多項(xiàng)AI新技術(shù)、新能力與大家開放共享,歡迎關(guān)注和使用,持續(xù)創(chuàng)造價值!
更多AI技術(shù)能力上新
不僅在產(chǎn)品前端和用戶體驗(yàn)上不斷優(yōu)化,針對不同行業(yè)及各個細(xì)分領(lǐng)域,百度智能云都在細(xì)節(jié)上進(jìn)行完善調(diào)整,在AI能力方面,從語音識別、文字識別、人體分析、圖像識別和車輛分析五個技術(shù)方向上,加速進(jìn)化產(chǎn)品能力和服務(wù)支持:
1、語音識別
這次,在語音識別能力上,升級了極速版接口,在以往pcm 、wav 、amr等語音格式基礎(chǔ)上,增加m4a格式支持。讓小程序也可實(shí)現(xiàn)直接調(diào)用,大大減少了音頻格式轉(zhuǎn)換所需的資源和時間,大幅提升接入效率,語音識別準(zhǔn)確率也有同步提升。
2、文字識別OCR
兩項(xiàng)新能力正式投入商用,其中火車票識別模型支持對紅藍(lán)火車票的8個關(guān)鍵字段,包括車票號碼、始發(fā)站、目的站等信息的結(jié)構(gòu)化識別。而出租車票識別模型支持對全國各大城市出租車票的6個關(guān)鍵字段,如發(fā)票號碼、金額等信息進(jìn)行結(jié)構(gòu)化識別。
這兩大模型的識別準(zhǔn)確率均超過95%,將為企業(yè)報稅帶來便利,能夠有效減少人工核算工作量,降低人力成本,實(shí)現(xiàn)財(cái)稅報銷的自動化。
3、人體分析
升級后的人流量統(tǒng)計(jì)優(yōu)化模型算法提升了人數(shù)統(tǒng)計(jì)的準(zhǔn)確率,50人以上的圖片,人數(shù)統(tǒng)計(jì)的平均準(zhǔn)確率高達(dá)98%以上。同時,升級后的模型算法支持框選多個不規(guī)則區(qū)域統(tǒng)計(jì)局部人數(shù),方便統(tǒng)計(jì)觀察圖片中多個重點(diǎn)區(qū)域的人群熱度,最多可一次性指定10個區(qū)域,這在安防監(jiān)控等場景下有著重要意義,可用于及時導(dǎo)流、限流,預(yù)警核心區(qū)域人群過于密集等安全隱患。
手部關(guān)鍵點(diǎn)識別現(xiàn)已開放邀測,檢測圖片中的手部并返回手部矩形框位置,定位手部的21個主要骨節(jié)點(diǎn),可用于自定義手勢檢測、AR 特效、人機(jī)交互等場景。
危險行為識別現(xiàn)已開放邀測,針對5s內(nèi)的監(jiān)控視頻片段,目前能支持識別7類危險行為,其中包括情緒性指人、摔倒、激烈抱怨、拉扯推搡、激烈摟抱和踢踹等動作的識別,應(yīng)用于特殊場景下,能協(xié)助日常的治安管理。
4、圖像識別:3項(xiàng)新能力全面開放
? 紅酒識別技術(shù) 意味著只要輸入一張圖片,就能識別圖像中的紅酒標(biāo)簽,返回紅酒名稱、國家、產(chǎn)區(qū)、等信息,現(xiàn)可識別數(shù)十萬中外紅酒,方便在電商購物、紅酒鑒定等場景使用。
? 貨幣識別技術(shù) 現(xiàn)可識別圖像中的貨幣類型,返回貨幣名稱、代碼、面值、年份信息,可識別百余種國內(nèi)外常見貨幣。
? 黑白圖像上色技術(shù) 只需上傳黑白照片,即可立刻獲得彩色照片?,F(xiàn)可接入小程序或網(wǎng)頁等,方便各種主題活動的開展。
5、車輛分析
? 車輛分割 目前該技術(shù)以識別小汽車為主,能識別車輛的輪廓并與背景進(jìn)行分離,并能夠返回分割后的二值圖、灰度圖、前景摳圖,除了各種角度外,在車門開啟等情形下也能識別。
更豐富的AI開發(fā)平臺
6月,百度智能云上新1個AI開發(fā)平臺:語音自訓(xùn)練平臺支持呼叫中心模型。同時發(fā)布了EasyDL訓(xùn)練和服務(wù)平臺的兩大新功能。讓你零代碼也能享受AI技術(shù)的強(qiáng)大。
1、EasyDL新發(fā)布智能標(biāo)注功能
EasyDL訓(xùn)練和服務(wù)平臺——物體檢測模型重磅推出智能標(biāo)注功能,面對數(shù)目龐大的訓(xùn)練數(shù)據(jù)集,開發(fā)者們只需優(yōu)先標(biāo)注數(shù)據(jù)集自動篩選出的約30%的關(guān)鍵圖片,EasyDL即可一鍵標(biāo)注剩余的圖片,輕松獲得效果優(yōu)質(zhì)的物體檢測模型。
2、EasyDL新發(fā)布定制視頻分類
智能識別視頻主體,根據(jù)主體動態(tài)變化分類。面向視頻分析場景,通過標(biāo)注每類50個、10s以內(nèi)的視頻片段進(jìn)行訓(xùn)練,從而實(shí)現(xiàn) “需要連續(xù)圖片幀組合判斷”的視頻內(nèi)容分析,可用于工人操作行為規(guī)范識別、環(huán)境變化監(jiān)控等場景中
3、語音自訓(xùn)練平臺支持呼叫中心模型正式發(fā)布
零代碼自助訓(xùn)練語音識別語言模型,上傳業(yè)務(wù)場景文本語料即可訓(xùn)練生成專屬模型,有效提升業(yè)務(wù)用語識別準(zhǔn)確率。平臺內(nèi)置呼叫中心模型可訓(xùn)練后進(jìn)行上線使用,支持呼叫中心實(shí)時語音識別、錄音文件轉(zhuǎn)寫等產(chǎn)品上使用。
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機(jī)業(yè)務(wù)
- 雅迪集團(tuán)與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍(lán)圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。