數碼新秩序

智城物語
23/02/2024

OpenAI Sora|一句話變60秒影片!OpenAI Sora生成電影級短片,將衝擊數碼娛樂產業,加劇深偽假片泛濫?

#Smart Living #短片 #OpenAI #生成模型 #Sora #電影級短片 #AI生成 #影片 #數碼娛樂 #智慧生活

  一名身穿黑色皮樓、紅色長裙與黑色皮靴的女子,戴著太陽眼鏡,在掛滿霓虹燈招牌的東京街頭漫步。這段看似平平無奇的短片,甫推出即引起轟動,全因它是由OpenAI新推出的影片生成模型「Sora」產製出來。用戶只需輸入提示詞,它就可以生成包含精細場景、複雜運鏡的1分鐘電影級短片,躍居業界標竿。但如此逼真的AI生成影片效果,卻可能對數碼娛樂產業帶來一定衝擊,甚至加劇深偽假影片的泛濫。

 

影片呈現細膩場景、複雜運鏡手法

 

  目前市場上的影片生成AI模型,頂多只能產製構圖簡單、鏡頭固定的十幾秒短片,例如較多人使用的Runway可以輸出4至18秒影片。OpenAI於2024年2月15日發表全新AI模型「Sora」,可根據用戶輸入的文字提示詞或靜態圖片,生成長達60秒的連貫流暢影片,猶如一石激起千重浪,震撼整個AI業界。

 

OpenAI在官網上架設了Sora專頁,講解該模型的運作原理,並展示40多段由Sora產製的演示影片。(圖片來源:翻攝OpenAI官網)

利用Sora所生成的東京女子街頭漫步短片,輸入AI提示詞為「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.」

(圖片來源:翻攝OpenAI演示影片)

 

  Sora的厲害之處在於,所輸出的1080p影片呈現出細膩精緻場景、生動角色表情,並加入複雜運鏡手法,產生有動態視角變化的畫面;當拍攝角度變換時,影片人物和事物皆能在立體空間中連貫移動。

 

  即使影片中的人物與事物被擋住或移出畫面,Sora仍能保持這些人與事存在於畫面範圍以外,當拍攝視角轉換到能看到時,就會將這些人與事重新呈現出來,並保持外觀和風格一致。科技網媒《Wired》盛讚,Sora生成的影片非常逼真,這是從未在其他AI模型作品中看過的真實感。

 

Sora生成的模擬航拍影片:一對情侶在櫻花道上行走,航拍機緊隨其後拍攝,視角產生多樣變化,而畫面一直保持著連貫性,影像逼真流暢。(圖片來源:翻攝OpenAI演示影片)

 

生成影像符合現實世界物理定律

 

  OpenAI表示,Sora能夠深入理解人類的語言,不但能準確地呈現提示詞所描述的各種事物,還可知曉這些事物是如何存在於現實世界,並要遵循那些物理規律。輝達(NVIDIA)資深研究科學家Jim Fan以咖啡杯內海盜船大戰的Sora影片為例,指出AI模擬兩艘海盜船在杯內互相追逐和對戰的場景,呈現出符合流體力學原理的咖啡液體流動。因此,他直言Sora是一個以數據驅動的物理引擎,能夠模擬真實或虛擬世界。

 

Sora生成的咖啡杯內海盜船大戰短片,對咖啡液體流動與光影變化處理均十分逼真,完全符合物理規律。(圖片來源:翻攝OpenAI演示影片)

 

  不過OpenAI坦承,Sora尚有不少待改進之處。它無法完全模擬複雜場景裏的物理規律,而且不太理解具體事例的因果關係,例如影片中人物吃了一口餅乾,惟餅乾卻依然完整無缺。再者,它有時會搞混了提示詞所述的空間細節,譬如左右不分,並且難以精確呈現隨著時間變化的事物。

 

降影片製作門檻人人皆可做導演

 

  儘管如此,Sora已大幅降低影片製作的門檻了。就算閣下沒有拍攝器材,又不懂得拍片和剪片技巧,只要用文字寫出你的想法,Sora即可將之轉化成短片,邁向「全民皆可做導演」的黃金年代。市調機構ABI Research高級分析師里斯·海登(Reece Hayden)認為,Sora這種影片生成模型將對數碼娛樂產業造成重大影響。

 

  若說Sora真正威脅到電影製作行業,可能還有一段很長的路要走。因為即使輸入完全相同的提示詞,AI每次生成的影片內容總會有所差異,所以不可能簡單地把120段1分鐘短片拼接起來,就可以合併成一齣劇情和畫面連貫的電影。

 

YouTuber擔憂被Sora完全取代

 

  觀乎Sora可以生成1分鐘短片的能耐,它很有機會成為顛覆社交媒體平台的新工具。近年Instagram Reels、YouTube Shorts、TikTok等短視頻格式相繼冒起,成為年輕網民最喜歡在社交媒體上收看的新類型內容。現在有了Sora,任何人都能用AI技術生成高質短片,這將進一步加快短視頻的普及。海登指出,未來針對不同受眾的客製化短片,將會在不同數碼渠道上廣泛傳播。

 

  然而,這樣卻令不少YouTuber和內容創作者擔憂,自己可能會否被AI完全取代。擁有逾1,800萬名訂戶的科技YouTuber馬克斯·布朗里(Marques Brownlee)表示,看到AI正在做他的工作,讓他感到恐懼,並覺得受到威脅。

 

OpenAI正開發AI影片檢測工具

 

  更嚴重的是,AI愈來愈逼真的影片生成能力,可能會令以深偽(Deepfake)技術製作的假影片變得更多,兼且更難以辨別。有鑑於此,逾400名來自學術界、政界、演藝界的知名人士聯署一封公開信,呼籲加強對深偽製品的監管,包括:要求AI公司預防其工具被用來生成有害的深偽成品、把深偽兒童色情製品全面定為犯罪、以及對任何故意生成或促進散播有害深偽作品的個人判處刑罰。

 

  正因為Sora可能會帶來巨大的潛在風險,所以OpenAI只將該模型定為研究預覽版本,暫未全面開放給公眾使用。除攻擊模擬團隊(Red Team)與有關AI專家外,目前Sora僅提供給少數受邀藝術家、設計師與電影製作人試用。

 

  OpenAI現正積極開發能夠檢驗AI生成影片的工具,並擬在Sora輸出影片中加入C2PA後設資料(Metadata),以便查證影片生成來源和相關資料。同時,Sora也會像圖片生成工具Dall-E般拒絕產製暴力、性或仇恨內容,以及名人相關影像。由此可見,OpenAI應該會在做好防範措施後,始會全面推出Sora服務。

 

02/08/2024

從西雅圖到香港:亞馬遜與經濟通30年平行宇宙!如何重塑人們消費購物、獲取財經資訊模式?

#Smart Living #電子商務 #互聯網 #經濟通 #亞馬遜 #美國 #Amazon #etnet #etnet30週年特輯 #財經媒體 #etnet30週年 #財經資訊 #消費購物

  在互聯網商業發展史上,1994年可說是里程碑之年。就在這一年,一家名為「亞馬遜」(Amazon)的網上書店在美國西雅圖悄然創立,開啟了往後30年全球電子商務的黃金盛世;在地球的另一邊,一家名為「經濟通」(etnet)的財經資訊供應商也在香港正式成立,揭開了此後30年香港財經媒體的輝煌時代。這兩家在平行線上各自創新的公司,究竟如何改變用戶消費購物與獲取財經資訊的習慣呢?

 

1994:亞馬遜、經濟通同步誕生

 

  1994年,傑夫·貝佐斯(Jeff Bezos)看好當時尚未普及的互聯網科技,於是辭掉在對沖基金公司的高薪厚職,在西雅圖家中的車庫創業。同年7月,他成立了一家名為「Cadabra」的公司,籌備開設網上書店。後來他認為公司名稱不夠好聽,決意另覓新名字——他希望新名字以英文字母A開頭,這樣在按字母排序的商業目錄中就可以更快被人找到。

 

  多番查閱字典後,貝佐斯決定以「Amazon」作為公司的新名字,因為他覺得亞馬遜是一個「富有異國情調且與眾不同」的地方,而且按流域面積和水流量計算,亞馬遜河是全球最大的河流,正好符合貝佐斯希望公司成為世界之最的期盼。貝佐斯的公司於1994年11月正式易名為亞馬遜,翌年7月Amazon網站正式營運,起初只銷售圖書,隨著業務擴張,開始涉足音樂、影視、電子產品等領域,逐步發展成網上百貨公司,為消費者提供一站式的網購平台。

 

亞馬遜的販售商品涵蓋圖書、影音作品、電子消費品、電器、廚具、食品、玩具、母嬰用品、化妝品、運動用具、服裝鞋帽等。(圖片來源:翻攝Amazon官網)

圖中是貝佐斯位於西雅圖都會區貝爾維尤(Bellevue)的家,Amazon公司於1994年在那裏成立。(圖片來源:維基百科)

 

  在太平洋的另一邊,經濟通也在1994年成立,以專線系統提供實時財經資訊。當時,資訊的獲取主要依賴於傳統媒體,投資者通常透過報紙或電視來獲取市場動態,但資訊傳遞卻存有延滯,追不上瞬息萬變的金融市場。經濟通的專線系統能夠提供即時股票報價和財經新聞,正可以彌補此問題,讓財經資訊可以更快速地傳播。

 

除香港外,經濟通業務範圍已涵蓋內地、澳門、台灣及日本等地區,成為區內各大金融機構的主要財經資訊來源。(圖片來源:翻攝經濟通官網)

 

2000:亞馬遜、經濟通各自崛起

 

  Amazon在成立初期一直處於虧蝕狀況,從1994至1997年累計有900萬美元(約7,020萬港元)的赤字。1997年5月,亞馬遜在納斯達克IPO上市,在上市申請表中非常坦蕩地告訴投資者,虧損在上市後仍會持續擴大,因為公司不但把大量金錢投入到營銷活動、技術開發、基礎建設等層面,還會繼續補貼降低商品價格,以吸引更多消費者嘗試網購,並強調不急於在4至5年內實現盈利。

 

  如此「緩慢」的增長模式自然惹來一眾股東的抱怨,認為公司業績成長不夠快,難以令其投資獲得合理回報,甚至無法在競爭激烈的科網市場存活下去。不過,當科網泡沫於2000年爆破後,很多互聯網公司相繼倒下,反而亞馬遜可以生存下來。2001年第4季,Amazon首度實現盈利,季度收入超過10億美元(約78億港元),淨利約500萬美元(約3,900萬港元)。這些都證明了貝佐斯的「緩慢」增長策略獲得成功。

 

  當亞馬遜網購業務不斷成長,伺服器和資源管理就成為最大的發展瓶頸。為解決此問題,公司內部工程團隊開發了一個網上服務平台「Amazon Web Services」(AWS),用作管理分散式、虛擬化伺服器和各種網上資源。其後,Amazon發現其他互聯網公司也遇上類似問題,所以在2006年將AWS對外開放。結果,這項新服務受到很多中小企和初創公司歡迎,讓亞馬遜成功開拓雲端藍海市場,最終躍居為全球最大的雲端供應商。

 

  隨著互聯網的興起,經濟通於2000年推出其網站,透過互聯網提供實時報價和財經資訊。這個轉變不僅擴大了用戶群,還豐富了服務內容,除基本的市場數據外,也有專家評論、新聞搜尋、市場分析報告及圖表等深度內容。同時,一般投資者亦可以通過電腦瀏覽網站上的豐富財經資訊,讓獲取即時財經信息不再是專業投資機構的專利。

 

  經濟通在2007年正式進駐北京開設記者站,與香港新聞部相互連接,以取得第一手的中國經濟資訊;2008年,更推出面向國內投資者的財經資訊網站etnetchina.com.cn,提供中港兩地的專業財經新聞及評論。

 

2010以後:亞馬遜、經濟通多元化發展

 

  當電商和雲端業務站穩陣腳後,Amazon就積極展開業務多元化部署。2014年,亞馬遜斥資9.7億美元(約75.66億港元)收購網上直播平台Twitch.tv,跨入社交媒體領域;2017年,豪擲137億美元(1,069億港元)買下連鎖超市Whole Foods Market,從網上轉戰到實體零售業;2018年,動用10億美元(約78億港元)併購網上藥局PillPack,涉足藥物零售。

 

  2022年,Amazon以84.5億美元(約659.1億港元)吞併電影公司米高梅(MGM),藉此強化旗下影音串流平台Prime Video的內容豐富度,並提升自製內容的製作能力,務求跟Netflix、Disney+一較高下。

 

  另一邊廂,因應智能手機的普及,經濟通推出了多款手機APP,讓用戶可以在手機上收看股票即時報價、成交分析、互動圖表、即時新聞、以及專家分析。此外,APP內又提供各種理財工具,包括:個人化監察表、ETF及基金精選及回報排行、定存息率比較、匯率比較、銀行交易匯價等。

 

etnet旗下有多款手機APP,包括:《財經·生活 經濟通》、《經濟通 股票強化版TQ》、以及《經濟通 財曆》。(圖片來源:翻攝Google Play官網)

 

  近年,隨著用戶需求的變化,經濟通開始推行內容多元化策略。除傳統的財經新聞外,etnet平台還推出了不同類型的內容頻道,包括:講解職場管理技巧、智能科技發展、消閒飲食娛樂情報的「生活」頻道;論述歐日韓潮流前瞻、藝術文化、兩性關係的「DIVA Channel」;涵蓋靚湯食譜、養生食療、運動瘦身的「健康好人生」。為吸引更廣泛的受眾,etnet又推出自製影片頻道「etnet TV」,內容涉及財經評論、風水知識、烹飪教學、吃喝玩樂、時尚潮流等。

 

  回顧過去30年,亞馬遜與經濟通的發展歷程,不僅僅是一家公司的成功故事,更是一個行業技術變革和市場變遷的縮影。Amazon從網上書店到電商霸主,etnet從專線系統供應商到財經數碼媒體巨頭,均展示了技術創新和市場策略的重要性。未來,隨著科技進步和市場需求變化,電子商務和財經資訊行業必將迎來更多的挑戰;在這個過程中,企業需要像亞馬遜、經濟通般不斷創新,保持靈活,才能在激烈的市場競爭中立於不敗之地。

 

#食譜 #素食 #數碼營銷 #電影 #移民 #減肥 #創科 #Netflix #外賣 #辦公室貼士 #疫情 #在家運動 #WFH #抗疫不悶 #限聚令 #辦公室求生術
more on etnet.com.hk