7月28日晚,繼上周阿里AI三連發(fā)后,阿里又扔出新的開(kāi)源模型,電影級(jí)視頻生成模型通義萬(wàn)相Wan2.2。Wan2.2直接將光影、色彩、鏡頭語(yǔ)言三大電影美學(xué)元素裝進(jìn)模型,可以隨意組合60多個(gè)直觀可控的參數(shù),大幅提升電影級(jí)畫(huà)面的制作效率。
通義萬(wàn)相官方展示了《星際穿越》、《布達(dá)佩斯大飯店》、《海上鋼琴師》等電影的經(jīng)典畫(huà)面,向影視經(jīng)典致敬,目前該模型單次可生成5s的高清視頻,用戶(hù)可通過(guò)多輪提示詞進(jìn)一步完成短劇制作,未來(lái)通義萬(wàn)相還將繼續(xù)提升單次視頻生成的時(shí)長(zhǎng),讓視頻創(chuàng)作更高效。
據(jù)介紹,Wan2.2此次共開(kāi)源文生視頻(Wan2.2-T2V-A14B)、圖生視頻(Wan2.2-I2V-A14B)和統(tǒng)一視頻生成(Wan2.2-TI2V-5B)三款模型,其中文生視頻模型和圖生視頻模型均為業(yè)界首個(gè)使用MoE架構(gòu)的視頻生成模型,總參數(shù)量為27B,激活參數(shù)14B,均由高噪聲專(zhuān)家模型和低噪專(zhuān)家模型組成,分別負(fù)責(zé)視頻的整體布局和細(xì)節(jié)完善,在同參數(shù)規(guī)模下,可節(jié)省約50%的計(jì)算資源消耗,有效解決視頻生成處理Token過(guò)長(zhǎng)導(dǎo)致的計(jì)算資源消耗大問(wèn)題,同時(shí)在復(fù)雜運(yùn)動(dòng)生成、人物交互、美學(xué)表達(dá)、復(fù)雜運(yùn)動(dòng)等維度上也取得了顯著提升。
Wan2.2還首創(chuàng)了電影美學(xué)控制系統(tǒng),光影、色彩、構(gòu)圖、微表情等能力媲美專(zhuān)業(yè)電影水平。例如,用戶(hù)輸入「黃昏」、「柔光」、「邊緣光」、「暖色調(diào)」「中心構(gòu)圖」等關(guān)鍵詞,模型可自動(dòng)生成金色的落日余暉的浪漫畫(huà)面;使用「冷色調(diào)」、「硬光」、「平衡圖」、「低角度」的組合,則可以生成接近科幻片的畫(huà)面效果。
輸入提示詞:視頻展示了一位三十多歲的黑人女性在黃昏色調(diào)的復(fù)古濾鏡下,平靜地坐在行駛中的地鐵車(chē)廂內(nèi)。周?chē)巳簛?lái)回走動(dòng),形成明顯的運(yùn)動(dòng)模糊,而她始終保持清晰,象征著混亂中的靜止。柔和的光線與電影畫(huà)質(zhì)營(yíng)造出喜怒無(wú)常的環(huán)境氛圍,突顯她在喧囂世界中的沉穩(wěn)與內(nèi)斂,呈現(xiàn)出強(qiáng)烈的現(xiàn)實(shí)主義風(fēng)格。通義萬(wàn)相即可精準(zhǔn)理解提示詞中的美學(xué)詞,并生成一段復(fù)古且富有文藝感的視頻。
輸入提示詞:白天,晴天光,邊緣光,暖色調(diào),低飽和度,極端全景,平衡構(gòu)圖,畫(huà)面中有兩名穿著宇航服的人,他們正站在一片廣闊的水域中。他們都穿著白色為主、帶有深色拼接和標(biāo)記的厚重宇航服,并頭戴配有面罩的頭盔。位于前方的人正朝著觀看者的方向涉水前行,水面淹及他的大腿,他的面部表情嚴(yán)肅。另一人站在他身后稍遠(yuǎn)的位置,同樣身處水中。在他們身后,一艘外形具有未來(lái)感的飛行器停泊在水面上。這艘飛行器有著扁平、寬大的機(jī)翼和棱角分明的設(shè)計(jì)。整個(gè)場(chǎng)景的背景是布滿(mǎn)云彩的天空和無(wú)邊無(wú)際的水面。通義萬(wàn)相可生成一段復(fù)刻電影《星際穿越》中宇航員在米勒星球的經(jīng)典畫(huà)面。
通義萬(wàn)相還開(kāi)源了一款5B小尺寸的統(tǒng)一視頻生成模型,單一模型同時(shí)支持文生視頻和圖生視頻,可在消費(fèi)級(jí)顯卡部署。該模型采用了高壓縮率3D VAE架構(gòu),時(shí)間與空間壓縮比達(dá)到高達(dá) 4×16×16,信息壓縮率提升至 64,均實(shí)現(xiàn)了開(kāi)源模型的最高水平,僅需22G顯存(單張消費(fèi)級(jí)顯卡)即可在數(shù)分鐘內(nèi)生成5秒高清視頻,是目前24幀每秒、720P像素級(jí)視頻生成速度最快的基礎(chǔ)模型之一。
即日起,開(kāi)發(fā)者可在GitHub、HuggingFace、魔搭社區(qū)下載模型和代碼,企業(yè)可在阿里云百煉調(diào)用模型API,用戶(hù)還可在通義萬(wàn)相官網(wǎng)和通義APP直接體驗(yàn)。
自今年2月以來(lái),通義萬(wàn)相已連續(xù)開(kāi)源文生視頻、圖生視頻、首尾幀生視頻和全能編輯等多款模型,在開(kāi)源社區(qū)的下載量已超500萬(wàn),是開(kāi)源社區(qū)最受歡迎的視頻生成模型之一。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 吉利攜階躍星辰亮相WAIC 2025 ,發(fā)布全域AI技術(shù)成果
- 中國(guó)兩款六代機(jī)加速測(cè)試,美國(guó)卻陷入麻煩之中,其實(shí)早有端倪
- 演唱會(huì)什么時(shí)候成了手機(jī)賽點(diǎn)?
- 4000萬(wàn)!餓了么前CEO被刑拘,7人被抓:平臺(tái)反腐從遮羞到“止血”
- 自研大模型+多模態(tài)交互!康佳易AI系統(tǒng)讓操作變“零門(mén)檻”
- 阿里AI四連發(fā),電影級(jí)視頻模型Wan2.2又開(kāi)源!
- WAIC見(jiàn)證中國(guó)AI突破:Rokid Glasses定義下一代交互標(biāo)準(zhǔn)
- 引領(lǐng)汽車(chē)加速向具身智能進(jìn)化 吉利汽車(chē)集團(tuán)攜階躍星辰聯(lián)合參展2025世界人工智能大會(huì)
- 吃掉喜馬拉雅,騰訊音樂(lè)增長(zhǎng)瓶頸有救了?
- 首個(gè)智能存力調(diào)度平臺(tái)啟動(dòng)!與算力網(wǎng)絡(luò)共同加速AI創(chuàng)新
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。