4月26日消息(田小夢)隨著元宇宙概念的推出,數(shù)字人也逐漸出圈,應用于傳媒、文旅等各行各業(yè),但高昂的制作和運營成本讓不少企業(yè)望而卻步。因此,“如何讓數(shù)字人成為小微企業(yè)經(jīng)營的‘可選項’,甚至成為個人創(chuàng)作者的創(chuàng)作工具?”成為致力于數(shù)字人領域企業(yè)關注的焦點。
4月25日,騰訊云智能推出了騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,可以輕松實現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
通過騰訊云智能小樣本數(shù)智人生產(chǎn)平臺,用戶只需要3分鐘真人口播視頻、100句語音素材,便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實時建模并生成高清人像,在24小時內(nèi)制作出與真人近似的“數(shù)智人”。
千元級別的成本、小時級的制作時長,大幅降低數(shù)字人使用門檻。騰訊云智能小樣本數(shù)智人為短視頻創(chuàng)作、知識分享、帶貨直播等場景應用提供了更多可能性。
奔向“更智慧、更懂行”
從騰訊數(shù)智人的發(fā)展脈絡來看,騰訊一直在致力于數(shù)字人發(fā)展。
據(jù)介紹,從2016年開始,騰訊就已經(jīng)開始接觸對話式AI,也就是早期的數(shù)字人,之后是語音對話方向。2018年,騰訊正式投入數(shù)智人研發(fā)和服務,成為國內(nèi)最早投入數(shù)字人領域的企業(yè)之一,目前騰訊已發(fā)布數(shù)百篇相關技術頂會、期刊論文、專利近百份。騰訊云智能數(shù)智人已經(jīng)覆蓋3D寫實、3D半寫實、3D卡通、2D真人、2D卡通五種形象風格。
一路走來,在騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊看來,騰訊數(shù)智人主要追求兩大方向——更智能、更懂行。
以此次騰訊重點推介的2D真人小樣本數(shù)智人為例,小樣本數(shù)智人不僅支持半身、全身形象展示,手勢動作會根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
在技術解讀中,騰訊優(yōu)圖實驗室研究總監(jiān)汪鋮杰表示,2D小樣本技術的背后是3D技術?!靶颖緮?shù)智人從直觀上感受是2D視頻,背后其實是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅(qū)動’再到‘2D人像視頻’的模式,通3D人臉結(jié)構的先驗信息引入,使數(shù)智人口型、表情更到位,讓小樣本數(shù)智人形象實現(xiàn)‘皺紋級’還原?!?/p>
另一方面,“小(樣本)"的背后是"大”?;谧员O(jiān)督機制的通用多模態(tài)模型經(jīng)過大規(guī)模數(shù)據(jù)訓練,可以將語音、文本與人像的表情、口型進行關聯(lián)?!?分鐘”的訓練視頻正是基于這個模型,學習每個人個性化的發(fā)音和口型特征。
除了數(shù)字人外形、交互等智能外,要看懂行,則離不開真實的落地應用。
陳磊坦言稱:“騰訊數(shù)智人從2018年到2023年,我們一直追求的目標是‘我們更懂行’?!蹦壳埃v訊云智能數(shù)智人從金融、傳媒,到文旅、出行、政務等十余個行業(yè),上百個具體的業(yè)務場景均已落地。
實現(xiàn)數(shù)智人快速普及的“背后”
使用門檻和運營成本是數(shù)字人發(fā)展過程中的兩座“大山”。
為加速數(shù)智人服務普及,騰訊云智能提出自動化“AI+數(shù)智人工廠”的方向。開箱即用的數(shù)智人生產(chǎn)服務,依托騰訊云TI平臺,內(nèi)置超過10項AI算法能力。未來,無需任何算法、研發(fā)經(jīng)驗,只要在平臺導入視頻、語音訓練素材,即可通過“自助式”服務,完成大批量數(shù)智人形象、音色定制。
針對數(shù)智人運營,騰訊云智能提供播報數(shù)智人平臺、交互數(shù)智人平臺服務。播報數(shù)智人平臺支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺可打造“超長待機”的數(shù)智員工,可定制專屬問答庫,提供7*24小時人機雙向交互服務。同時,也可實現(xiàn)數(shù)智人直播服務,直播間7*24小時不斷檔,自由切換真人語音接管,與用戶問答互動。
陳磊表示,騰訊云智能專注做厚aPaaS數(shù)智人平臺,以API接口形式向合作伙伴開放“產(chǎn)、銷、服”一體化服務,支持合作伙伴開發(fā)更多適用于垂直行業(yè)、垂直場景的數(shù)智人SaaS服務。目前,已經(jīng)有數(shù)十家合作伙伴依托平臺,向行業(yè)提供數(shù)智人直播SaaS、知識口播SaaS應用,覆蓋醫(yī)療、傳媒、金融多個行業(yè)。
作為騰訊云智能的生態(tài)集成伙伴,醫(yī)微訊創(chuàng)始人、CEO潘耿表示,騰訊云智能數(shù)智人生產(chǎn)及運營能力的開放,助力我們?yōu)榭蛻舸蛟炝诉m用于醫(yī)療行業(yè)的數(shù)字人服務。微媒數(shù)字會議CEO天狐表示,微媒將全力和云智能共創(chuàng)數(shù)字分身解決方案,形成可持續(xù)發(fā)展的品牌營銷生態(tài),為企業(yè)與個人進行IP打造。
此外,騰訊研究院高級研究員宋揚對未來數(shù)字人的發(fā)展給予了厚望。他認為,數(shù)字人的本質(zhì)是降本增效,它將會成為交互的新入口,在深度上和應用上會有深度的挖掘。同時,數(shù)字人未來的應用是非常廣泛的,技術+行業(yè)會擦出有深度的應用。
- 美科技七巨頭遭特朗普關稅血洗 市值蒸發(fā)14萬億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設智信普惠科技公司,布局多領域技術服務
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價雙輪驅(qū)動成關鍵
- 本地生活賽道:2025年紅海變“血?!保脚_競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復接收中國包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對美股市場造成新一輪打擊
- 谷歌股價暴跌:收入增長放緩,人工智能支出引投資者擔憂
- 華為去年銷售收入超8600億元:ICT基礎設施穩(wěn)健,新業(yè)務快速發(fā)展
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。