18/06/2024
【FOCUS】OpenAI喜憂參半,中國冀「開源」超車
在微軟和蘋果之間左右逢源的OpenAI,近日喜憂參半。喜的是旗下大語言模型ChatGPT,上月訪問量刷新月度紀錄;憂的是旗下驚艷一時的視頻生成工具Sora,正被「老師傅」、「後來者」圍獵。此外,內地AI公司DeepSeek近日發布第二代MoE大機型DeepSeek-V2並開源,或顯示中國在發展AI的道路選擇上,傾向走全球共建開源開放體系。
Runway再反超Sora
「得AI者得天下」,看看牽手人工智能公司OpenAI的微軟、蘋果,市值雄踞美股冠亞軍;繼去年營收逾20億美元後,OpenAI執行長Sam Altman最新預計,今年營收將達34億美元。而加持公司高達860億美元估值的,當屬被視作「地表最強」的大語言模型ChatGPT,5月訪問量按月飆升75%至逾31.6億次,顯示使用者的興趣愈來愈大。
Runway擁有獨一無二的運動筆刷、高級攝像機控制、導演模式功能。
不過,在另一AI視頻生成工具賽道,四個月前推出Sora吊打行業老大Runway的OpenAI,近日卻再被Runway全新的Gen-3版本反超。Runway擁有獨一無二的運動筆刷(Motion Brush)、高級攝像機控制、導演模式功能,令創作者能細緻調整畫面,此正正是構建通用世界模型(general world models)的關鍵,即捕捉世界的真實視覺和物理動態。
快手KLING效果吸睛
碾壓Sora的還有中國第二大短視頻應用快手,本月初推出的文字生成視頻模型KLING(可靈)。相比Sora無法理解特定的因果關係,例如餅乾被咬一口後仍完整無缺,KLING可真實還原孩子吃漢堡、男人吃麵條的場景。在視頻長度方面,KLING將Sora的1分鐘擴展至2分鐘,顯示訓練基礎設施更高效。
KLING可真實還原孩子吃漢堡、男人吃麵條的場景。
Sora至今仍只開放內測(僅向部分電影製片人、視覺藝術家、設計師開放),但KLING能以中國內地手機號預約免費使用。此外,美國AI新創公司Luma上周推出的文字生成視頻模型Dream Machine,任何人都可免費生成5秒鐘的高清視頻。
被圍獵的Sora會否很快轉向免費開放使用?一大關鍵因素即是算力,例如Dream Machine生成5秒視頻耗時需三四分鐘,而Sora生成1分鐘視頻動輒需要一小時。OpenAI早前就指,Sora在準備好迎接黃金時段前還有很長的路要走。
借開放降技術門檻
但AI之爭時不待人,第二代MoE大機型DeepSeek-V2大模型,中文綜合能力媲美GPT4 Torbo,但token(自然語言處理過程中用來表示單字或片語的符號)價格僅是後者的近百分之一,被戲稱為「AI屆的拼多多」。
DeepSeek-V2大模型oken價格僅是ChatGPT的近百分之一,被戲稱為「AI屆的拼多多」。
更值一提的是,DeepSeek-V2選擇完全開源(GPT、Gemini、Claude等大模型均為閉源),再加上同樣開源的通義千問、訊飛星火等,或顯示中國在發展AI的道路選擇上,傾向用開放形成統一的技術體系。
此呼應了中國工程院院士孫凝暉較早時為全國人大常委會進行專題講座所指,中國發展AI的三條道路選擇,分別是追趕兼容美國主導的A體系,建構專用封閉的B體系,以及全球共建開源開放的C體系;三正正是用開源打破生態壟斷,降低企業擁有核心技術的門檻,最有望實現打破現狀的願景。
【你點睇】港府本年度已錄逾2千億元赤字,有議員指或難符基本法力求收支平衡之規定。你認為當局應如何解決財政問題?► 立即投票