02/09/2024
OpenAI神秘研發計劃曝光!Strawberry能力超越當今AI模型極限!可顛覆世人對AI技術認知?
OpenAI曾於2023年底爆出宮鬥風波,執行長奧特曼一度被董事局罷免,有傳原因是他秘密研發一個可能會威脅人類的AI項目「Q*」,並已取得重大突破。當奧特曼復職後,此項目的研發代號改為「Strawberry」(士多啤梨),並繼續低調推進。近日有報道指,Strawberry或會在2024年秋季亮相,其能力更遠超當今所有AI模型!究竟它的誕生可以把AI技術引領到甚麼新境界?
OpenAI執行長奧特曼8月初在其X.com帳戶上傳了一張花園中栽種士多啤梨的照片,惹人無限遐想。(圖片來源:X.com@sama)
上網搜尋資料,自主採取行動
科技網媒The Information引述消息人士指,OpenAI或許在2024年秋季發表代號「Strawberry」 的嶄新AI模型,更有望整合至ChatGPT。據說,Strawberry能夠解決現今大型語言模型無法應付的難題。譬如,它可以解開從沒見過的數學問題、協助擬定市場營銷策略、甚至破解複雜的文字解謎遊戲。此外,在常用於衡量AI模型數學能力的MATH基準測試中,Strawberry AI得分超過90%,遠勝GPT-4的53%與GPT-4o的76.6%。
除回答用戶一般提問外,Strawberry更具備處理長期任務(Long-horizon Tasks)的能力。當面對複雜任務時,它不但懂得提前做好規劃,還可以在電腦代理程式(Computer-Using Agent,CUA)的幫助下自行上網搜尋資料,隨後更會依據搜尋結果採取行動,在較長一段時間內依靠CUA執行一系列相關操作。
透過後訓練強化AI理解能力
OpenAI利用一個名為「深度研究」(Deep Research)的專門化數據集,替Strawberry進行「後訓練」(Post-training);換言之,其大型語言模型經過大量常識數據的預訓練(Pre-training),完成初步開發後,再以特定知識領域的數據進行後訓練,以強化它在專門領域的理解能力。為測試Strawberry的實際效果,OpenAI會用它來執行軟件與機器學習工程師的工作。
其實,Strawberry的訓練方式類似美國史丹福大學(Stanford University)於2022年開發的「自學推理者」(Self-Taught Reasoner,STaR)。它透過反覆建立訓練數據來自我訓練,逐步提升AI模型的推理能力層級,藉此達到、甚至超越人類智慧的境界。STaR的開發者之一、史丹福大學教授諾亞·古德曼(Noah Goodman)接受傳媒訪問時直言,自己跟Strawberry無關,倘若它真的可以追上人類推理能力,那是讓人既興奮、又恐懼之事。
史丹福大學教授古德曼表示,STaR可以讓AI模型自我生成訓練數據,藉此引導自己進入更高的智能水平,理論上最終可以超越人類的智慧。(圖片來源:X.com@Stanford)
未來AI發展將經歷5級演進
2024年7月11日,OpenAI發表對未來AI發展的構想,認為AI將會經歷5個層級的演進:
● 第一級:聊天機械人(Chatbots),具有一般對答能力的AI;
● 第二級:推理者(Reasoners),擁有人類水平解難能力的AI;
● 第三級:代理者(Agents),能夠採取實際行動的AI;
● 第四級:創新者(Innovators),可協助人類創新發明的AI;
● 第五級:組織者(Organizations),可以完成組織工作的AI。
如此看來,ChatGPT正屬於第一級AI,而Strawberry很有可能是幫助OpenAI實現第二級AI的關鍵。OpenAI執行長山姆·奧特曼(Sam Altman)曾表示,AI領域最重要的演進將圍繞在推理能力之上。其他科技巨頭如Google、微軟(Microsoft),以至大部分從事AI研究的學術實驗室,都認為提升AI推理能力是解鎖大型語言模型潛力的關鍵。
OpenAI執行長奧特曼認為,在AI領域中最重要的技術演進就是推理能力的進步。(圖片來源:翻攝OpenAI官方YouTube影片)
新AI已交給美國國安官員審查
不過,有另一派研究人員持有不同看法。圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)常說,驅動ChatGPT等AI工具的大型語言模型,永遠無法達到像人類般的推理和規劃能力,因為這類模型不了解物理世界,對邏輯的理解非常有限,所以無法根據任何合理的定義進行推理,也無法進行規劃。
儘管外界對Strawberry議論紛紛,但OpenAI官方卻未有承認其存在,只表示「不斷研究新 AI 能是業界的常見做法,人們普遍相信AI系統的推理能力會隨著時間演進而提升。」事實上,Strawberry的開發正好符合OpenAI的使命:創建比人類更聰明的「通用人工智能」(Artificial General Intelligence,AGI),造福全人類。The Information透露,Strawberry現已提交給美國國家安全官員進行審查,預計將於2024年秋季某個時候面世。
OpenAI成立的使命是,研製通用人工智能,藉此造福人類。(圖片來源:Unsplash圖庫)
克服AI推理能力局限關鍵項目
Strawberry是否真的會在2024年內推出尚未確定,外界估計OpenAI可能會先釋出原始模型的精煉版本,能以較低運算力實現相近的AI能力。另有消息指,OpenAI正在研發比GPT-4更強的新一代模型,開發代號為「Orion」;Strawberry負責生成高質數據給Orion進行訓練,藉此降低後者的回答出錯率。
Strawberry的前身「Q*」曾被視為可能會威脅人類,更被認為是董事會決定踢走奧特曼的導火線。但隨著奧特曼閃電回巢,Strawberry不僅成為OpenAI克服AI推理能力局限的關鍵項目,更是開發次世代大型語言模型的幕後推手,重要性已顯得無以復加。一旦Strawberry成功了,將會重新定義AI的能力——能夠發掘重大科學發現、開發前所未見新型軟件,並自主執行複雜任務,那麼人類離AGI又進一步了!
《說說心理話》:講講常見年輕人理財問題!想「人有我有」?認可理財社工分享理財觀念小秘訣!► 即睇