】 【打 印】 
【 第1頁 第2頁 第3頁 】 
顛覆影視行業?Sora能做到嗎
http://www.CRNTT.com   2024-02-28 10:13:38


(圖源:齊魯晚報)
  中評社北京2月28日電/據齊魯晚報報導,在ChatGPT問世一年多後,OpenAI再度“進化”,日前發布首個AI文字生成視頻模型Sora。使用者只需通過文字描述場景,Sora就能生成類似電影的逼真場景,涵蓋多個角色、不同類型動作和背景細節等,最高能生成1分鐘左右的1080P高清視頻,引發業界極大的震撼。Sora的出現被看作“人工智能領域的一次重大突破”,顯著提高了AI文字生成視頻的能力上限,為今後的文明進步帶來更多樣的可能性。Sora究竟是什麼?未來將給影視行業帶來哪些變化與挑戰?
效果媲美“大片”

  近日,由Sora生成的一段時長59秒的視頻,在社交網絡上廣為流傳。畫面中,一位戴墨鏡、身穿紅裙皮衣、踩著皮靴的女人,漫步在東京街頭,鏡頭流暢地推到了她的臉部,可以清晰地看到她臉上的雀斑和皮膚紋理。這個一鏡到底的視頻不需要人來拍攝和剪輯,只要把一段文字描述輸入Sora後由AI直接生成。此外,OpenAI還公布了其他幾段視頻,幾只巨大的毛茸茸的猛獁象踏著白雪皚皚的草地走近、一個毛茸茸的小怪物跪在融化的紅蠟燭旁邊……視頻質量媲美“大片”,視覺效果也十分逼真。

  除了生成的畫面高度接近現實物理世界,OpenAI介紹,Sora可以實現視頻中的主題始終保持一致,即使暫時離開視野也不會發生變化,並可以一次性生成多機位視頻,還可以依靠對語言的深入理解準確地解釋提示詞,保留角色和視覺風格。有網友感慨,“它將把視頻內容帶入‘零基礎創作’時代”。

  電影學者李超在接受齊魯晚報採訪時,向記者展示了一段由AI提煉的相關背景介紹:Sora模型的核心是擴散模型,它從“隨機噪聲”開始,經過上百個細致的處理階段,最終演化成為一個連貫且生動的視頻場景。此外,Sora還結合了語言理解和視覺生成技術,能夠創建複雜的場景和角色。“Sora實際上是物理世界通用模擬器。”李超進一步解釋說。

  不少科技從業人員也從不同角度對Sora進行點評。馬斯克在社交平台上踴躍發言,“人類願賭服輸”“人類借助AI之力將創造出卓越作品”;AI文生視頻創企Runway聯合創始人克里斯托瓦爾·巴倫蘇埃拉感慨後浪拍前浪,以前需要花費一年的進展,變成了幾個月就能實現,又變成了幾天、幾小時;出門問問創始人李志飛在朋友圈感嘆:“LLM(大型語言模型)ChatGPT是虛擬思維世界的模擬器,以LLM為基礎的視頻生成模型Sora是物理世界的模擬器,物理和虛擬世界都被建模和模擬了,到底什麼是現實?”
 


【 第1頁 第2頁 第3頁 】 


掃描二維碼訪問中評網移動版 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: