AI＋Robot始動！機械人初創Figure獲OpenAI投資，人形機械人成為AI競賽致勝新關鍵？-方展策

AI＋Robot始動！機械人初創Figure獲OpenAI投資，人形機械人成為AI競賽致勝新關鍵？

#Smart Living

#機械人

#Nvidia

#AI

#人形機械人

#OpenAI

#生成式AI

#創科

#AI產品

#智慧生活

#微軟

#輝達

#Microsoft

#初創創業

#科技

#Figure

　　生成式AI（Generative AI）不單可以產製文案或程式碼，還可以生成圖片或影片，但這一切都只局限於電腦屏幕上。若要AI走出屏幕，就需要可以在現實世界中活動的機械身軀。近日美國加州一家人形機械人初創公司Figure，從新一輪融資中取得OpenAI、微軟（Microsoft）、輝達（NVIDIA）等重量級AI巨頭的高額投資，看來機械人已成為AI技術投資的延伸，變成AI賽道上的下一個兵家必爭之地。

Figure取得GPT大型語言模型

　　2024年2月29日，僅成立兩年的Figure宣布，在B輪募資中獲得6.75億美元（約52.65億港元）融資。這是該公司繼2023年上半年取得A輪7,000萬美元（約5.46億港元）融資之後宣布的最新融資動態，使公司估值攀升至26億美元（約202.8億港元）。比融資金額更惹人注目之處是，參與這輪募資的投資者名單：OpenAI、微軟、NVIDIA、英特爾（Intel）、以及亞馬遜（Amazon）創辦人傑夫·貝佐斯（Jeff Bezos）家族辦公室等，無一不是AI業界的主要玩家。

Figure 創立於2022年，其團隊由來自特斯拉（Tesla）、Google DeepMind、波士頓動力（Boston Dynamics）等的AI與機械人專家所組成。（圖片來源：Figure官網）

　　更重要的是，Figure藉此跟OpenAI達成合作協議，共同開發下一代人形機械人的AI模型。這意味著Figure機械人將會使用OpenAI旗下的GPT大型語言模型、DALL-E圖像生成模型、以至Sora影片生成模型。OpenAI產品及合作夥伴關係副總裁彼得‧韋林德（Peter Welinder）表示，該公司一直計劃重返機械人技術領域，現在Figure讓他們看到人形機械人結合大型語言模型後可以實現甚麼。

Figure機械人理解說話背後意圖

　　宣布獲得OpenAI投資的十幾天後，Figure於3月14日發表首段採用OpenAI模型的機械人示範影片。測試人員向代號為「Figure 01」的機械人表示：「我可以吃點東西嗎？」它回答說：「當然可以」，然後就拿起枱面上的蘋果遞給測試人員。接著測試人員詢問Figure 01，為甚麼要這樣做，它回應道：「這是我唯一能拿給你吃的東西」。

　　這代表著Figure 01能夠理解測試人員說話背後蘊含的意圖，進而與人類進行完整的對話。即使測試人員下達的指示不夠具體，但它也能透過視像鏡頭所看到的東西，再加上對說話指示的理解與推理後，順利完成任務。由此可見，它可以跟人類作出有意義的互動，這使得它比以往的機械人更為實用。

在OpenAI模型加持下，Figure 01機械人能夠完全聽從人類的指示，包括：把蘋果遞給人類、將垃圾收拾進框子、並把杯子和盤子放回瀝水架上。（圖片來源：翻攝Figure官方YouTube影片）

測試人員要求Figure 01機械人幫忙沖咖啡：它打開咖啡機的蓋子，將咖啡膠囊放進咖啡機裡；一旦發現咖啡膠囊沒有放對位置，Figure 01會伸手將咖啡膠囊擺正。（圖片來源：翻攝Figure官方YouTube影片）

AI機械人幫助緩解勞動力短缺

　　Figure創辦人兼執行長布雷特·阿德考克（Brett Adcock）解釋指，Figure 01的視像鏡頭背後有OpenAI訓練的大型視覺語言模型（Vision-Language Model）進行影像分析。因此，它具備觀察學習能力，可以透過觀看人類行為來理解和完成任務。如果將Figure 01引進到工廠，就能夠執行不適合人類的危險或繁瑣工作，這將有助於紓緩全球勞動力不足的問題。

　　隨著愈來愈多國家呈現人口老化、勞動人口下滑，人力短缺現象只會愈趨嚴重。國際顧問公司Korn Ferry評估，及至2030年全球將面對逾8,500萬人的人手短缺，令到全球產值每年損失8.5兆美元（約66.3兆港元）。AI機械人的出現，正可以填補這個缺口。高盛（Goldman Sachs）預測，未來10至15年內，人形機械人市場規模有望達到60億美元（約468億港元）以上。

OpenAI四出投資機械人初創

　　其實，Figure已於2024年1月跟德國車廠BMW簽署合作協議，Figure機械人在未來12至24個月接受特定任務訓練後，將被部署到BMW的汽車生產線上。如今Figure獲得OpenAI的視覺語言模型與新一輪融資資金，將加速其人形機械人的研發，以投入到製造、運輸、物流及倉儲等不同領域，協助緩解產業缺工。

　　除Figure之外，OpenAI曾於2023年3月領投挪威機械人初創1X Technologies，替其完成2,350萬美元（約1.83億港元）的A2輪融資，用於開發處理日常家務的雙足機械人NEO。2024年3月，OpenAI再投資另一機械人初創Physical Intelligence，助其完成7,000萬美元（約5.46億港元）的種子輪融資，目標是研發通用型AI機械人軟件系統，務求將同一套演算法應用到不同類型的機械人上。

　　由此視之，OpenAI在稱霸生成式AI領域後，下一步將劍指AI機械人市場。倘若數碼世界的AI工具與現實世界的AI機械人均由OpenAI所主導，其AI霸權勢將變得牢不可破了！

02/09/2024

OpenAI神秘研發計劃曝光！Strawberry能力超越當今AI模型極限！可顛覆世人對AI技術認知？

#Smart Living #OpenAI #數碼轉型 #通用人工智能 #Sam Altman #AI #史丹福大學 #ChatGPT #規劃能力 #Strawberry #Q* #推理能力 #語言模型

　　OpenAI曾於2023年底爆出宮鬥風波，執行長奧特曼一度被董事局罷免，有傳原因是他秘密研發一個可能會威脅人類的AI項目「Q*」，並已取得重大突破。當奧特曼復職後，此項目的研發代號改為「Strawberry」（士多啤梨），並繼續低調推進。近日有報道指，Strawberry或會在2024年秋季亮相，其能力更遠超當今所有AI模型！究竟它的誕生可以把AI技術引領到甚麼新境界？

OpenAI執行長奧特曼8月初在其X.com帳戶上傳了一張花園中栽種士多啤梨的照片，惹人無限遐想。（圖片來源：X.com@sama）

上網搜尋資料，自主採取行動

　　科技網媒The Information引述消息人士指，OpenAI或許在2024年秋季發表代號「Strawberry」的嶄新AI模型，更有望整合至ChatGPT。據說，Strawberry能夠解決現今大型語言模型無法應付的難題。譬如，它可以解開從沒見過的數學問題、協助擬定市場營銷策略、甚至破解複雜的文字解謎遊戲。此外，在常用於衡量AI模型數學能力的MATH基準測試中，Strawberry AI得分超過90%，遠勝GPT-4的53%與GPT-4o的76.6%。

　　除回答用戶一般提問外，Strawberry更具備處理長期任務（Long-horizon Tasks）的能力。當面對複雜任務時，它不但懂得提前做好規劃，還可以在電腦代理程式（Computer-Using Agent，CUA）的幫助下自行上網搜尋資料，隨後更會依據搜尋結果採取行動，在較長一段時間內依靠CUA執行一系列相關操作。

透過後訓練強化AI理解能力

　　OpenAI利用一個名為「深度研究」（Deep Research）的專門化數據集，替Strawberry進行「後訓練」（Post-training）；換言之，其大型語言模型經過大量常識數據的預訓練（Pre-training），完成初步開發後，再以特定知識領域的數據進行後訓練，以強化它在專門領域的理解能力。為測試Strawberry的實際效果，OpenAI會用它來執行軟件與機器學習工程師的工作。

　　其實，Strawberry的訓練方式類似美國史丹福大學（Stanford University）於2022年開發的「自學推理者」（Self-Taught Reasoner，STaR）。它透過反覆建立訓練數據來自我訓練，逐步提升AI模型的推理能力層級，藉此達到、甚至超越人類智慧的境界。STaR的開發者之一、史丹福大學教授諾亞·古德曼（Noah Goodman）接受傳媒訪問時直言，自己跟Strawberry無關，倘若它真的可以追上人類推理能力，那是讓人既興奮、又恐懼之事。

史丹福大學教授古德曼表示，STaR可以讓AI模型自我生成訓練數據，藉此引導自己進入更高的智能水平，理論上最終可以超越人類的智慧。（圖片來源：X.com@Stanford）

未來AI發展將經歷5級演進

　　2024年7月11日，OpenAI發表對未來AI發展的構想，認為AI將會經歷5個層級的演進：

● 第一級：聊天機械人（Chatbots），具有一般對答能力的AI；

● 第二級：推理者（Reasoners），擁有人類水平解難能力的AI；

● 第三級：代理者（Agents），能夠採取實際行動的AI；

● 第四級：創新者（Innovators），可協助人類創新發明的AI；

● 第五級：組織者（Organizations），可以完成組織工作的AI。

　　如此看來，ChatGPT正屬於第一級AI，而Strawberry很有可能是幫助OpenAI實現第二級AI的關鍵。OpenAI執行長山姆·奧特曼（Sam Altman）曾表示，AI領域最重要的演進將圍繞在推理能力之上。其他科技巨頭如Google、微軟（Microsoft），以至大部分從事AI研究的學術實驗室，都認為提升AI推理能力是解鎖大型語言模型潛力的關鍵。

OpenAI執行長奧特曼認為，在AI領域中最重要的技術演進就是推理能力的進步。（圖片來源：翻攝OpenAI官方YouTube影片）

新AI已交給美國國安官員審查

　　不過，有另一派研究人員持有不同看法。圖靈獎得主、Meta首席AI科學家楊立昆（Yann LeCun）常說，驅動ChatGPT等AI工具的大型語言模型，永遠無法達到像人類般的推理和規劃能力，因為這類模型不了解物理世界，對邏輯的理解非常有限，所以無法根據任何合理的定義進行推理，也無法進行規劃。

　　儘管外界對Strawberry議論紛紛，但OpenAI官方卻未有承認其存在，只表示「不斷研究新 AI 能是業界的常見做法，人們普遍相信AI系統的推理能力會隨著時間演進而提升。」事實上，Strawberry的開發正好符合OpenAI的使命：創建比人類更聰明的「通用人工智能」（Artificial General Intelligence，AGI），造福全人類。The Information透露，Strawberry現已提交給美國國家安全官員進行審查，預計將於2024年秋季某個時候面世。

OpenAI成立的使命是，研製通用人工智能，藉此造福人類。（圖片來源：Unsplash圖庫）

克服AI推理能力局限關鍵項目

　　Strawberry是否真的會在2024年內推出尚未確定，外界估計OpenAI可能會先釋出原始模型的精煉版本，能以較低運算力實現相近的AI能力。另有消息指，OpenAI正在研發比GPT-4更強的新一代模型，開發代號為「Orion」；Strawberry負責生成高質數據給Orion進行訓練，藉此降低後者的回答出錯率。

　　Strawberry的前身「Q*」曾被視為可能會威脅人類，更被認為是董事會決定踢走奧特曼的導火線。但隨著奧特曼閃電回巢，Strawberry不僅成為OpenAI克服AI推理能力局限的關鍵項目，更是開發次世代大型語言模型的幕後推手，重要性已顯得無以復加。一旦Strawberry成功了，將會重新定義AI的能力——能夠發掘重大科學發現、開發前所未見新型軟件，並自主執行複雜任務，那麼人類離AGI又進一步了！

數碼新秩序

AI＋Robot始動！機械人初創Figure獲OpenAI投資，人形機械人成為AI競賽致勝新關鍵？

OpenAI神秘研發計劃曝光！Strawberry能力超越當今AI模型極限！可顛覆世人對AI技術認知？