23/02/2024

OpenAI Sora｜一句話變60秒影片！OpenAI Sora生成電影級短片，將衝擊數碼娛樂產業，加劇深偽假片泛濫？

#Smart Living #短片 #OpenAI #生成模型 #Sora #電影級短片 #AI生成 #影片 #數碼娛樂 #智慧生活

加入最愛專欄
收藏文章

方展策
方展策
少年時，曾研習 Geographic Information System，可惜學無所成，僥倖畢業。成年後，誤打誤撞進入傳媒圈子，先後在印刷、電子、網絡媒體打滾，略有小成。中年後，修畢資訊科技碩士，眼界漸擴，決意投身初創企業，窺探不同科技領域。近年，積極鑽研數據分析與數碼策略，又涉足 Location Intelligence 開發項目；有時還會抽空執教鞭，既可向他人分享所學，亦可鞭策自己保持終身學習。
智城物語

　　一名身穿黑色皮樓、紅色長裙與黑色皮靴的女子，戴著太陽眼鏡，在掛滿霓虹燈招牌的東京街頭漫步。這段看似平平無奇的短片，甫推出即引起轟動，全因它是由OpenAI新推出的影片生成模型「Sora」產製出來。用戶只需輸入提示詞，它就可以生成包含精細場景、複雜運鏡的1分鐘電影級短片，躍居業界標竿。但如此逼真的AI生成影片效果，卻可能對數碼娛樂產業帶來一定衝擊，甚至加劇深偽假影片的泛濫。

影片呈現細膩場景、複雜運鏡手法

　　目前市場上的影片生成AI模型，頂多只能產製構圖簡單、鏡頭固定的十幾秒短片，例如較多人使用的Runway可以輸出4至18秒影片。OpenAI於2024年2月15日發表全新AI模型「Sora」，可根據用戶輸入的文字提示詞或靜態圖片，生成長達60秒的連貫流暢影片，猶如一石激起千重浪，震撼整個AI業界。

OpenAI在官網上架設了Sora專頁，講解該模型的運作原理，並展示40多段由Sora產製的演示影片。（圖片來源：翻攝OpenAI官網）

利用Sora所生成的東京女子街頭漫步短片，輸入AI提示詞為「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.」

（圖片來源：翻攝OpenAI演示影片）

　　Sora的厲害之處在於，所輸出的1080p影片呈現出細膩精緻場景、生動角色表情，並加入複雜運鏡手法，產生有動態視角變化的畫面；當拍攝角度變換時，影片人物和事物皆能在立體空間中連貫移動。

　　即使影片中的人物與事物被擋住或移出畫面，Sora仍能保持這些人與事存在於畫面範圍以外，當拍攝視角轉換到能看到時，就會將這些人與事重新呈現出來，並保持外觀和風格一致。科技網媒《Wired》盛讚，Sora生成的影片非常逼真，這是從未在其他AI模型作品中看過的真實感。

Sora生成的模擬航拍影片：一對情侶在櫻花道上行走，航拍機緊隨其後拍攝，視角產生多樣變化，而畫面一直保持著連貫性，影像逼真流暢。（圖片來源：翻攝OpenAI演示影片）

生成影像符合現實世界物理定律

　　OpenAI表示，Sora能夠深入理解人類的語言，不但能準確地呈現提示詞所描述的各種事物，還可知曉這些事物是如何存在於現實世界，並要遵循那些物理規律。輝達（NVIDIA）資深研究科學家Jim Fan以咖啡杯內海盜船大戰的Sora影片為例，指出AI模擬兩艘海盜船在杯內互相追逐和對戰的場景，呈現出符合流體力學原理的咖啡液體流動。因此，他直言Sora是一個以數據驅動的物理引擎，能夠模擬真實或虛擬世界。

Sora生成的咖啡杯內海盜船大戰短片，對咖啡液體流動與光影變化處理均十分逼真，完全符合物理規律。（圖片來源：翻攝OpenAI演示影片）

　　不過OpenAI坦承，Sora尚有不少待改進之處。它無法完全模擬複雜場景裏的物理規律，而且不太理解具體事例的因果關係，例如影片中人物吃了一口餅乾，惟餅乾卻依然完整無缺。再者，它有時會搞混了提示詞所述的空間細節，譬如左右不分，並且難以精確呈現隨著時間變化的事物。

降影片製作門檻人人皆可做導演

　　儘管如此，Sora已大幅降低影片製作的門檻了。就算閣下沒有拍攝器材，又不懂得拍片和剪片技巧，只要用文字寫出你的想法，Sora即可將之轉化成短片，邁向「全民皆可做導演」的黃金年代。市調機構ABI Research高級分析師里斯·海登（Reece Hayden）認為，Sora這種影片生成模型將對數碼娛樂產業造成重大影響。

　　若說Sora真正威脅到電影製作行業，可能還有一段很長的路要走。因為即使輸入完全相同的提示詞，AI每次生成的影片內容總會有所差異，所以不可能簡單地把120段1分鐘短片拼接起來，就可以合併成一齣劇情和畫面連貫的電影。

YouTuber擔憂被Sora完全取代

　　觀乎Sora可以生成1分鐘短片的能耐，它很有機會成為顛覆社交媒體平台的新工具。近年Instagram Reels、YouTube Shorts、TikTok等短視頻格式相繼冒起，成為年輕網民最喜歡在社交媒體上收看的新類型內容。現在有了Sora，任何人都能用AI技術生成高質短片，這將進一步加快短視頻的普及。海登指出，未來針對不同受眾的客製化短片，將會在不同數碼渠道上廣泛傳播。

　　然而，這樣卻令不少YouTuber和內容創作者擔憂，自己可能會否被AI完全取代。擁有逾1,800萬名訂戶的科技YouTuber馬克斯·布朗里（Marques Brownlee）表示，看到AI正在做他的工作，讓他感到恐懼，並覺得受到威脅。

OpenAI正開發AI影片檢測工具

　　更嚴重的是，AI愈來愈逼真的影片生成能力，可能會令以深偽（Deepfake）技術製作的假影片變得更多，兼且更難以辨別。有鑑於此，逾400名來自學術界、政界、演藝界的知名人士聯署一封公開信，呼籲加強對深偽製品的監管，包括：要求AI公司預防其工具被用來生成有害的深偽成品、把深偽兒童色情製品全面定為犯罪、以及對任何故意生成或促進散播有害深偽作品的個人判處刑罰。

　　正因為Sora可能會帶來巨大的潛在風險，所以OpenAI只將該模型定為研究預覽版本，暫未全面開放給公眾使用。除攻擊模擬團隊（Red Team）與有關AI專家外，目前Sora僅提供給少數受邀藝術家、設計師與電影製作人試用。

　　OpenAI現正積極開發能夠檢驗AI生成影片的工具，並擬在Sora輸出影片中加入C2PA後設資料（Metadata），以便查證影片生成來源和相關資料。同時，Sora也會像圖片生成工具Dall-E般拒絕產製暴力、性或仇恨內容，以及名人相關影像。由此可見，OpenAI應該會在做好防範措施後，始會全面推出Sora服務。

《經濟通》所刊的署名及／或不署名文章，相關內容屬作者個人意見，並不代表《經濟通》立場，《經濟通》所扮演的角色是提供一個自由言論平台。

【你點睇】陳美寶、羅淑佩分別被任命為運物局及文體旅局局長，你是否認同新任命有助香港鞏固物流樞紐地位及促進旅遊經濟？► 立即投票