文本到圖像的AI一直是藝術(shù)家脖子上的痛,現(xiàn)在是時候讓電影制作人感受到刺痛了。一家名為Runway Research的公司向我們介紹了Gen-2(通過Tom's Guide)。這是一個人工智能驅(qū)動的文本到視頻機(jī)器人,看起來相當(dāng)不錯......可怕的好。
OpenAI是AI行業(yè)的搖滾明星,生產(chǎn)了DALL-E和ChatGPT等熱門產(chǎn)品。但是,該公司還沒有讓我們體驗文本到視頻的功能。使用 GPT-4,我們認(rèn)為我們會看到類似的東西;然而,它被證明是類固醇的 ChatGPT-3。
跑道研究將Gen-2推下“跑道”
因此,文本到圖像技術(shù)已經(jīng)是勞動密集型的。生成一個雙手凌亂的戰(zhàn)士公主的照片需要一公噸的信息和處理能力。因此,將其帶到全動態(tài)視頻中似乎就像科幻電影中的東西。然而,它正在發(fā)生。
命名為Gen-2,這是Runway Research的第二代創(chuàng)意,該公司展示了它如何改進(jìn)Gen-1。您可以在此處查看 Gen-2 可以執(zhí)行的操作的一些示例。
現(xiàn)在,在你興奮之前,有幾件事需要知道。對于初學(xué)者來說,此工具尚不可用。我們不知道它什么時候會上市,但該公司說“很快”。
另外,不要開始計劃你的下一部短片。到目前為止,Gen-2只能產(chǎn)生3秒的視頻循環(huán)。因此,它暫時基本上會制作 GIF。無論如何,它仍然令人印象深刻。
您將能夠從文本提示生成短視頻剪輯,但您也可以使用視頻輸入。有一個片段,一個男人把頭轉(zhuǎn)向鏡頭。這是輸入視頻。輸出顯示一個生物(基于源圖像)轉(zhuǎn)動頭部。還有一個例子,Gen-2拍攝了金毛獵犬的源視頻并添加了斑點狗斑點。
這將使Runway進(jìn)一步成為人們關(guān)注的焦點。目前,就公眾而言,OpenAI正在引領(lǐng)AI競賽,而谷歌則落后。另一家公司進(jìn)一步火上澆油將使人工智能競賽變得有趣。