香港商報
-- 天氣
OpenAI首個視頻生成模型發布 細節炸裂 文化還原略差

OpenAI首個視頻生成模型發布 細節炸裂 文化還原略差

責任編輯:程向明 2024-02-16 15:21:17 來源:香港商報網

 美國時間2月16日凌晨,OpenAI再次扔出一枚深水炸彈,發布了首個文字生成視頻模型Sora。據介紹,Sora可以直接輸出長達1分鐘的視頻,並且包含高度細致的背景、複雜的多角度鏡頭,以及富有情感的多個角色等。

 目前OpenAI官網上已經更新了48個視頻demo,在這些demo中,Sora不僅能準確呈現細節,還能理解物體在物理世界中的存在,並生成具有豐富情感的角色。該模型還可以根據提示、靜止圖像甚至填補現有視頻中的缺失帧來生成視頻。記者注意到,總體上這些視頻已非常逼真、細節炸裂,但在文化方面,還難以原汁原味,只是體現了西方視野下的文化要素。

6a65d52e6407bb3a9546eb30444dd061.gif

行駛中的列車窗外偶遇遮擋,車內人物倒影短暫出現非常驚艷。

046e515c505fc00151a43e2963aeac44.gif

AI想像中的舞龍,西方特點明顯。

490c7dfe4ee7ae21885c2ca493a1bbaa.gif

雨後東京街頭,潮濕地面反射霓虹燈光影效果堪比RTX ON。

70194d0bd6de2047c3390c166ab6b5bd.gif

豎屏超近景視角下,這隻蜥蜴細節拉滿。

39492a61c0beed91e7fe99e5cfb92f54.gif

43efea8415deb36ed48a94b01d51456d.gif

fa312d03e0f7187438708f89c00eb9e9.gif

 

 OpenAI表示,正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現實世界交互的問題。根據文本提示生成視頻,僅僅是整個計劃其中的一步。目前Sora已經能生成具有多個角色、包含特定運動的複雜場景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。 

 據悉,目前已有一些視覺藝術家、設計師和電影製作人(以及OpenAI員工)獲得了Sora訪問權限。

責任編輯:程向明 OpenAI首個視頻生成模型發布 細節炸裂 文化還原略差
香港商報PDF
股市

友情鏈接

承印人、出版人:香港商報有限公司 地址:香港九龍觀塘道332號香港商報大廈 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83517835 83518291

地址:香港九龍觀塘道332號香港商報大廈