02/09/2024

OpenAI神秘研發計劃曝光！Strawberry能力超越當今AI模型極限！可顛覆世人對AI技術認知？

#Smart Living #OpenAI #數碼轉型 #通用人工智能 #Sam Altman #AI #史丹福大學 #ChatGPT #規劃能力 #Strawberry #Q* #推理能力 #語言模型

加入最愛專欄
收藏文章

方展策
方展策
少年時，曾研習 Geographic Information System，可惜學無所成，僥倖畢業。成年後，誤打誤撞進入傳媒圈子，先後在印刷、電子、網絡媒體打滾，略有小成。中年後，修畢資訊科技碩士，眼界漸擴，決意投身初創企業，窺探不同科技領域。近年，積極鑽研數據分析與數碼策略，又涉足 Location Intelligence 開發項目；有時還會抽空執教鞭，既可向他人分享所學，亦可鞭策自己保持終身學習。
智城物語

　　OpenAI曾於2023年底爆出宮鬥風波，執行長奧特曼一度被董事局罷免，有傳原因是他秘密研發一個可能會威脅人類的AI項目「Q*」，並已取得重大突破。當奧特曼復職後，此項目的研發代號改為「Strawberry」（士多啤梨），並繼續低調推進。近日有報道指，Strawberry或會在2024年秋季亮相，其能力更遠超當今所有AI模型！究竟它的誕生可以把AI技術引領到甚麼新境界？

OpenAI執行長奧特曼8月初在其X.com帳戶上傳了一張花園中栽種士多啤梨的照片，惹人無限遐想。（圖片來源：X.com@sama）

上網搜尋資料，自主採取行動

　　科技網媒The Information引述消息人士指，OpenAI或許在2024年秋季發表代號「Strawberry」的嶄新AI模型，更有望整合至ChatGPT。據說，Strawberry能夠解決現今大型語言模型無法應付的難題。譬如，它可以解開從沒見過的數學問題、協助擬定市場營銷策略、甚至破解複雜的文字解謎遊戲。此外，在常用於衡量AI模型數學能力的MATH基準測試中，Strawberry AI得分超過90%，遠勝GPT-4的53%與GPT-4o的76.6%。

　　除回答用戶一般提問外，Strawberry更具備處理長期任務（Long-horizon Tasks）的能力。當面對複雜任務時，它不但懂得提前做好規劃，還可以在電腦代理程式（Computer-Using Agent，CUA）的幫助下自行上網搜尋資料，隨後更會依據搜尋結果採取行動，在較長一段時間內依靠CUA執行一系列相關操作。

透過後訓練強化AI理解能力

　　OpenAI利用一個名為「深度研究」（Deep Research）的專門化數據集，替Strawberry進行「後訓練」（Post-training）；換言之，其大型語言模型經過大量常識數據的預訓練（Pre-training），完成初步開發後，再以特定知識領域的數據進行後訓練，以強化它在專門領域的理解能力。為測試Strawberry的實際效果，OpenAI會用它來執行軟件與機器學習工程師的工作。

　　其實，Strawberry的訓練方式類似美國史丹福大學（Stanford University）於2022年開發的「自學推理者」（Self-Taught Reasoner，STaR）。它透過反覆建立訓練數據來自我訓練，逐步提升AI模型的推理能力層級，藉此達到、甚至超越人類智慧的境界。STaR的開發者之一、史丹福大學教授諾亞·古德曼（Noah Goodman）接受傳媒訪問時直言，自己跟Strawberry無關，倘若它真的可以追上人類推理能力，那是讓人既興奮、又恐懼之事。

史丹福大學教授古德曼表示，STaR可以讓AI模型自我生成訓練數據，藉此引導自己進入更高的智能水平，理論上最終可以超越人類的智慧。（圖片來源：X.com@Stanford）

未來AI發展將經歷5級演進

　　2024年7月11日，OpenAI發表對未來AI發展的構想，認為AI將會經歷5個層級的演進：

● 第一級：聊天機械人（Chatbots），具有一般對答能力的AI；

● 第二級：推理者（Reasoners），擁有人類水平解難能力的AI；

● 第三級：代理者（Agents），能夠採取實際行動的AI；

● 第四級：創新者（Innovators），可協助人類創新發明的AI；

● 第五級：組織者（Organizations），可以完成組織工作的AI。

　　如此看來，ChatGPT正屬於第一級AI，而Strawberry很有可能是幫助OpenAI實現第二級AI的關鍵。OpenAI執行長山姆·奧特曼（Sam Altman）曾表示，AI領域最重要的演進將圍繞在推理能力之上。其他科技巨頭如Google、微軟（Microsoft），以至大部分從事AI研究的學術實驗室，都認為提升AI推理能力是解鎖大型語言模型潛力的關鍵。

OpenAI執行長奧特曼認為，在AI領域中最重要的技術演進就是推理能力的進步。（圖片來源：翻攝OpenAI官方YouTube影片）

新AI已交給美國國安官員審查

　　不過，有另一派研究人員持有不同看法。圖靈獎得主、Meta首席AI科學家楊立昆（Yann LeCun）常說，驅動ChatGPT等AI工具的大型語言模型，永遠無法達到像人類般的推理和規劃能力，因為這類模型不了解物理世界，對邏輯的理解非常有限，所以無法根據任何合理的定義進行推理，也無法進行規劃。

　　儘管外界對Strawberry議論紛紛，但OpenAI官方卻未有承認其存在，只表示「不斷研究新 AI 能是業界的常見做法，人們普遍相信AI系統的推理能力會隨著時間演進而提升。」事實上，Strawberry的開發正好符合OpenAI的使命：創建比人類更聰明的「通用人工智能」（Artificial General Intelligence，AGI），造福全人類。The Information透露，Strawberry現已提交給美國國家安全官員進行審查，預計將於2024年秋季某個時候面世。

OpenAI成立的使命是，研製通用人工智能，藉此造福人類。（圖片來源：Unsplash圖庫）

克服AI推理能力局限關鍵項目

　　Strawberry是否真的會在2024年內推出尚未確定，外界估計OpenAI可能會先釋出原始模型的精煉版本，能以較低運算力實現相近的AI能力。另有消息指，OpenAI正在研發比GPT-4更強的新一代模型，開發代號為「Orion」；Strawberry負責生成高質數據給Orion進行訓練，藉此降低後者的回答出錯率。

　　Strawberry的前身「Q*」曾被視為可能會威脅人類，更被認為是董事會決定踢走奧特曼的導火線。但隨著奧特曼閃電回巢，Strawberry不僅成為OpenAI克服AI推理能力局限的關鍵項目，更是開發次世代大型語言模型的幕後推手，重要性已顯得無以復加。一旦Strawberry成功了，將會重新定義AI的能力——能夠發掘重大科學發現、開發前所未見新型軟件，並自主執行複雜任務，那麼人類離AGI又進一步了！

《經濟通》所刊的署名及／或不署名文章，相關內容屬作者個人意見，並不代表《經濟通》立場，《經濟通》所扮演的角色是提供一個自由言論平台。

【你點睇？】財政預算案展開公眾諮詢，學者倡問責官員減薪並削減公務員編制，你是否認同？ ► 立即投票

我要回應

OpenAI神秘研發計劃曝光！Strawberry能力超越當今AI模型極限！可顛覆世人對AI技術認知？

智城物語．方展策量子時代來臨！Google Willow突破量子運算瓶頸，效能輾壓超級電腦，如何改變未來科技格局？新文章

版主留言

智城物語 ． 方展策

量子時代來臨！Google Willow突破量子運算瓶頸，效能輾壓超級電腦，如何改變未來科技格局？ 新文章

智慧城市5.0 ． 鄧淑明

電商教室 ． 掌舖Boutir團隊

智叻生活 ． Ada Chow

向太搭飛機危難關頭笑看生死 爆李連杰嚇怕頭夾兩腿間 浴缸摔倒怕佔用公共資源唔坐白車 新文章

我做Marketing ． Michael & Derek

Bitcoin必學 ． 田十十

銷售達人 ． 梁子驄 Brian

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

示範做訓練時客易犯錯的動作｜掌上壓、深蹲、划船 姿勢不正確非常危險！ 新文章

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

得閒拉筋 得閒Build肌 ． 馬德荃 Derek Ma

食療新意思 ． 陳沛思

山今養生智慧 ． 山今老人岑逸飛

食療新意思 ． 陳沛思

嘉‧點健康 ． 利嘉敏

食療新意思 ． 陳沛思

山今養生智慧 ． 山今老人岑逸飛

山今養生智慧 ． 山今老人岑逸飛

山今養生智慧 ． 山今老人岑逸飛

山今養生智慧 ． 山今老人岑逸飛

玩樂 What’s On ． Eunice Chow

聖誕好去處2024︱海港城12.24發放煙火及煙霧泡泡，慈善捐款見聖誕老人 跨年倒數煙花匯演入場券詳情 新文章

Foodie What’s On ． Katty Wu

玩樂 What’s On ． wong lin lin rachel

聖誕電影2024｜鄭伊健陳卓賢《久別重逢》奇幻穿越！甄子丹《誤判》改編真實個案爭取公議 新文章

玩樂 What’s On ． Eunice Chow

玩樂 What’s On ． Eunice Chow

尖沙咀恐龍會客室12.20開放：專家清修恐龍化石，動植物化石展覽，九龍公園文物探知館免費入場 新文章

Foodie What’s On ． wong lin lin rachel

著數速遞 ． Eunice Chow

玩樂 What’s On ． wong lin lin rachel

澳門華泰食館 正宗泰式船麵的魅力、一碗「黑湯」打天下 新文章

Shopping What’s On ． Eunice Chow

下年度《財政預算案》本月15日起展開公眾諮詢，陳茂波指須更謹慎管理公共財政。有學者建議問責官員帶頭減薪並削減公務員編制，你是否認同該學者建議？(368人參與)56

政府擬立法規定所有的士須於車廂內安裝攝錄設備，有人支持該政策，認為能更好解決乘車糾紛，有市民則有私隱疑慮。有的士司機表示安裝成本高，影響生計，政府回應不會承擔安裝費用。你是否認同該政策？(100人參與)1

Sex & Love>男男女女‧「嘉」點情趣

Sex & Love>我單身但我快樂

Travel & Dining>「世」界味覺之旅

Beauty>Get it Beauty！

Travel & Dining>玩味誌

Art & Living>ChatENT

Fashion>The Dapper Style

新文章

余君雋 新文章

馬天娜 新文章

雷鼎鳴 新文章

智城物語．方展策
量子時代來臨！Google Willow突破量子運算瓶頸，效能輾壓超級電腦，如何改變未來科技格局？新文章

智城物語．方展策

量子時代來臨！Google Willow突破量子運算瓶頸，效能輾壓超級電腦，如何改變未來科技格局？新文章

智慧城市5.0 ．鄧淑明

電商教室．掌舖Boutir團隊

智叻生活． Ada Chow

向太搭飛機危難關頭笑看生死爆李連杰嚇怕頭夾兩腿間浴缸摔倒怕佔用公共資源唔坐白車新文章

Bitcoin必學．田十十

銷售達人．梁子驄 Brian

得閒拉筋得閒Build肌．馬德荃 Derek Ma

示範做訓練時客易犯錯的動作｜掌上壓、深蹲、划船姿勢不正確非常危險！新文章

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

得閒拉筋得閒Build肌．馬德荃 Derek Ma

食療新意思．陳沛思

山今養生智慧．山今老人岑逸飛

食療新意思．陳沛思

嘉‧點健康．利嘉敏

食療新意思．陳沛思

山今養生智慧．山今老人岑逸飛

山今養生智慧．山今老人岑逸飛

山今養生智慧．山今老人岑逸飛

山今養生智慧．山今老人岑逸飛

聖誕好去處2024︱海港城12.24發放煙火及煙霧泡泡，慈善捐款見聖誕老人跨年倒數煙花匯演入場券詳情新文章

聖誕電影2024｜鄭伊健陳卓賢《久別重逢》奇幻穿越！甄子丹《誤判》改編真實個案爭取公議新文章

尖沙咀恐龍會客室12.20開放：專家清修恐龍化石，動植物化石展覽，九龍公園文物探知館免費入場新文章

著數速遞． Eunice Chow

澳門華泰食館正宗泰式船麵的魅力、一碗「黑湯」打天下新文章

余君雋新文章

馬天娜新文章

雷鼎鳴新文章