蜜度攜“跨模態(tài)信息檢索”與“智能校對(duì)”兩大應(yīng)用開(kāi)啟數(shù)智化新未來(lái)

在剛剛落幕的2022世界人工智能大會(huì)(WAIC)中,上海蜜度信息技術(shù)有限公司不僅與上海市人工智能行業(yè)協(xié)會(huì)主辦了“數(shù)據(jù)智能與內(nèi)容認(rèn)知高峰論壇”,邀請(qǐng)數(shù)據(jù)智能領(lǐng)域的國(guó)內(nèi)外頂級(jí)學(xué)者共同深度探討了技術(shù)演進(jìn)與未來(lái)愿景;在展覽活動(dòng)中更通過(guò)“蜜小智”“蜜小度”“蜜小校”等虛擬形象,帶領(lǐng)觀眾沉浸式地感受了跨模態(tài)信息檢索與智能校對(duì)兩大數(shù)據(jù)智能應(yīng)用在具體場(chǎng)景中的賦能。

作為蜜度以強(qiáng)大科研能力與深邃行業(yè)洞察研發(fā)的兩大創(chuàng)新應(yīng)用,跨模態(tài)信息檢索和智能校對(duì)能夠成為深化數(shù)據(jù)價(jià)值和提升工作效率的重要途徑?;趦烧叩亩鄨?chǎng)景數(shù)據(jù)智能產(chǎn)品和解決方案,也已經(jīng)為不同行業(yè)用戶(hù)提供了從數(shù)據(jù)融合到智能認(rèn)知、從策略生成到自動(dòng)處理的全流程服務(wù),全面助力政府及企業(yè)的數(shù)智化轉(zhuǎn)型升級(jí)。

跨模態(tài)檢索:匯集湍流,覓取一瓢

人類(lèi)活動(dòng)伴隨著信息的產(chǎn)生與散播,而隨著技術(shù)的進(jìn)階,信息的模態(tài)也從單一文本向多模態(tài)發(fā)展,包括圖片、音頻和視頻在內(nèi)的多模態(tài)信息占比越來(lái)越大。而當(dāng)湍流般的龐雜訊息噴涌而至,跨越模態(tài)的檢索能幫助我們更接近我們尋覓的答案。

在技術(shù)角度,跨模態(tài)的實(shí)現(xiàn)主要依賴(lài)以下四個(gè)層面的技術(shù):

一是跨模態(tài)對(duì)比學(xué)習(xí),指首先從單模態(tài)數(shù)據(jù)中的相似性排序進(jìn)行數(shù)據(jù)增強(qiáng),再使用對(duì)應(yīng)特征計(jì)算對(duì)比學(xué)習(xí)損失,最終使模型在多模態(tài)任務(wù)中的表現(xiàn)更為出色。

二是跨模態(tài)語(yǔ)義融合,指通過(guò)整合不同模態(tài)間的模型和特征,提高理解能力與效率,實(shí)現(xiàn)對(duì)語(yǔ)音文字文本的自動(dòng)糾錯(cuò),提升識(shí)別準(zhǔn)確率。

三是跨模態(tài)語(yǔ)義表征,指整合多模態(tài)信息,并對(duì)表征進(jìn)行聯(lián)合,從而實(shí)現(xiàn)視頻內(nèi)容的一體化識(shí)別。

四是跨模態(tài)語(yǔ)義檢索,指通過(guò)用搜索特征向量對(duì)海量目標(biāo)高維向量進(jìn)行近似最近鄰計(jì)算,實(shí)現(xiàn)語(yǔ)義檢索及TopN相似結(jié)果的召回,最終提高檢索結(jié)果的精度。

秉承高效而全面的跨模態(tài)檢索能力,蜜度旗下跨模態(tài)檢索平臺(tái)“蜜度索驥”在保障了文本判讀與圖片識(shí)別準(zhǔn)確率的同時(shí),還能夠智能識(shí)別圖片中的文字內(nèi)容,準(zhǔn)確解析視頻中的字幕、背景、封面等特征元素。

對(duì)模型的細(xì)節(jié)優(yōu)化同樣步履不停,目前,蜜度索驥已實(shí)現(xiàn)對(duì)常規(guī)常見(jiàn)場(chǎng)景的快速識(shí)別與提取,并針對(duì)一百余個(gè)政務(wù)類(lèi)單位、近300個(gè)特殊場(chǎng)景進(jìn)行加強(qiáng)訓(xùn)練,實(shí)現(xiàn)特殊場(chǎng)景識(shí)別;并通過(guò)智能識(shí)別能力輸出視覺(jué)、語(yǔ)音多維度內(nèi)容標(biāo)簽,進(jìn)一步提高檢索效率。

目前,蜜度旗下的蜜度索驥、蜜度版權(quán)通、城感通等產(chǎn)品已經(jīng)植入了先進(jìn)的跨模態(tài)檢索能力,為社會(huì)治理、網(wǎng)絡(luò)安全、版權(quán)保護(hù)、品牌決策、營(yíng)銷(xiāo)洞察等場(chǎng)景打造了標(biāo)桿化應(yīng)用。

除了各種場(chǎng)景化應(yīng)用之外,跨模態(tài)檢索的發(fā)展也為AIGC(AI Generated Content,人工智能自主生成內(nèi)容)帶來(lái)了前所未有的勢(shì)能。一個(gè)極好的例子就是正在迅猛發(fā)展中的AI繪畫(huà)——借助大模型的跨模態(tài)綜合技術(shù)能力,人工智能可以通過(guò)表征學(xué)習(xí)將圖像、視頻、音頻、語(yǔ)義等多模態(tài)信息融合,再佐以跨模態(tài)數(shù)據(jù)的協(xié)同訓(xùn)練,最終讓抽象的自然語(yǔ)言可以經(jīng)由預(yù)訓(xùn)練模型自動(dòng)完成視覺(jué)圖像的自動(dòng)生成。

蜜度AI小畫(huà)家“蜜小度”繪制作品

隨著人工智能技術(shù)的全局發(fā)展,跨模態(tài)檢索提升的不僅是搜索效率與結(jié)果質(zhì)量,同樣也幫助我們突破人腦的創(chuàng)意限制,用貼切的想象力營(yíng)建更精彩的未來(lái)世界。

智能校對(duì):一目萬(wàn)行,纖悉無(wú)遺

蜜度在智能校對(duì)應(yīng)用能力通過(guò)結(jié)合行業(yè)先進(jìn)的自然語(yǔ)言處理、知識(shí)圖譜與光學(xué)字符識(shí)別等技術(shù),實(shí)現(xiàn)了對(duì)中文文本和語(yǔ)義關(guān)系錯(cuò)誤的自動(dòng)發(fā)現(xiàn)與糾正處理,可廣泛應(yīng)用于政府公文、新聞稿件、日常寫(xiě)作等場(chǎng)景,在降低差錯(cuò)概率和提升文本質(zhì)量的同時(shí),也大幅度提高工作效率。

在技術(shù)角度,智能校對(duì)的實(shí)現(xiàn)主要有以下特點(diǎn):

一是基于“大數(shù)據(jù)+大模型”,百億級(jí)別的平衡語(yǔ)料,實(shí)現(xiàn)細(xì)微語(yǔ)義信息的捕捉、辨別。

二是專(zhuān)用校對(duì)知識(shí)圖譜,以知識(shí)圖譜技術(shù)驅(qū)動(dòng),刻畫(huà)人物、機(jī)構(gòu)、地域等實(shí)體關(guān)系,實(shí)現(xiàn)時(shí)政相關(guān)表述校對(duì),讓字符串擁有關(guān)聯(lián)語(yǔ)義。

三是專(zhuān)業(yè)領(lǐng)域校對(duì)賦能,通過(guò)集成學(xué)習(xí)技術(shù),能夠快速形成不同行業(yè)的校對(duì)能力。

蜜度旗下AI智能校對(duì)平臺(tái)“蜜度校對(duì)通”就是基于智能校對(duì)應(yīng)用而開(kāi)發(fā)的專(zhuān)業(yè)軟件。蜜度校對(duì)通圍繞中文語(yǔ)言特點(diǎn)及使用習(xí)慣,以百億級(jí)訓(xùn)練語(yǔ)料為基礎(chǔ),覆蓋文字標(biāo)點(diǎn)差錯(cuò)、知識(shí)性差錯(cuò)、內(nèi)容導(dǎo)向風(fēng)險(xiǎn)三大審核與校對(duì)類(lèi)型,并擁有25類(lèi)全棧審核與校對(duì)能力,能夠?qū)﹀e(cuò)別字、詞,多字、少字錯(cuò)誤,語(yǔ)義重復(fù),語(yǔ)序錯(cuò)誤,句式雜糅,量與單位差錯(cuò);專(zhuān)有名詞及術(shù)語(yǔ),法律法規(guī)名稱(chēng),常識(shí)差錯(cuò)等內(nèi)容進(jìn)行智能審核與校對(duì),有效解決內(nèi)容的規(guī)范性、安全性、合法性問(wèn)題。

無(wú)論是政務(wù)單位的日常公文、思想?yún)R報(bào)、宣傳稿、工作總結(jié)等材料;還是圖書(shū)、期刊、科研報(bào)告、論文、媒體通稿、專(zhuān)題報(bào)道等文稿;抑或音像電子、網(wǎng)絡(luò)游戲等電子出版物;以及企業(yè)軟文、品宣物料、策劃案等內(nèi)容,都可以由蜜度校對(duì)通執(zhí)行快速錯(cuò)敏校對(duì),一站式全方位地提高內(nèi)容質(zhì)量,保障內(nèi)容安全。

AI智能校對(duì)平臺(tái)——蜜度校對(duì)通

就在此次2022世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng),軟硬件本地化智能解決方案——校對(duì)通AI-Box也正式發(fā)布,作為首個(gè)通過(guò)華為昇騰AI生態(tài)認(rèn)證的本地化智能校對(duì)解決方案,校對(duì)通AI-Box既可以在本地化的部署下,充分保障數(shù)據(jù)私密性;也能夠作為專(zhuān)屬的邊緣計(jì)算,大幅度提升用戶(hù)工作效率;同時(shí)也在融入華為昇騰 AI 生態(tài)體系的過(guò)程中,與主流國(guó)產(chǎn)系統(tǒng)共同營(yíng)造高質(zhì)量的數(shù)字辦公體驗(yàn)。

對(duì)數(shù)據(jù)最好的尊重是智能化地挖掘它們蘊(yùn)藏的價(jià)值,而在此過(guò)程中,我們不僅可以凝集人類(lèi)的過(guò)往經(jīng)驗(yàn)用以打造更快捷的算法模型,也需要人工智能使用不同于人腦的方式感知這個(gè)世界,從而開(kāi)辟一個(gè)全新的方式,不僅理解萬(wàn)物,也汲取能量,最終創(chuàng)造更精彩的未來(lái)。

人工智能是屬于這個(gè)時(shí)代的強(qiáng)大工具,它不僅是信息檢索長(zhǎng)途上的同行者,也是重構(gòu)世界的創(chuàng)造者,而作為數(shù)據(jù)智能領(lǐng)域的領(lǐng)軍者,蜜度致力于用每一點(diǎn)技術(shù)進(jìn)步,推動(dòng)各行各業(yè)的數(shù)智化發(fā)展,與業(yè)內(nèi)合作伙伴以及廣大用戶(hù)一同,眾行致遠(yuǎn),探索浩瀚。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )