數碼新秩序

智城物語
19/04/2024

AI+Robot始動!機械人初創Figure獲OpenAI投資,人形機械人成為AI競賽致勝新關鍵?

#Smart Living #機械人 #Nvidia #AI #人形機械人 #OpenAI #生成式AI #創科 #AI產品 #智慧生活 #微軟 #輝達 #Microsoft #初創創業 #科技 #Figure

  生成式AI(Generative AI)不單可以產製文案或程式碼,還可以生成圖片或影片,但這一切都只局限於電腦屏幕上。若要AI走出屏幕,就需要可以在現實世界中活動的機械身軀。近日美國加州一家人形機械人初創公司Figure,從新一輪融資中取得OpenAI、微軟(Microsoft)、輝達(NVIDIA)等重量級AI巨頭的高額投資,看來機械人已成為AI技術投資的延伸,變成AI賽道上的下一個兵家必爭之地。

 

Figure取得GPT大型語言模型

 

  2024年2月29日,僅成立兩年的Figure宣布,在B輪募資中獲得6.75億美元(約52.65億港元)融資。這是該公司繼2023年上半年取得A輪7,000萬美元(約5.46億港元)融資之後宣布的最新融資動態,使公司估值攀升至26億美元(約202.8億港元)。比融資金額更惹人注目之處是,參與這輪募資的投資者名單:OpenAI、微軟、NVIDIA、英特爾(Intel)、以及亞馬遜(Amazon)創辦人傑夫·貝佐斯(Jeff Bezos)家族辦公室等,無一不是AI業界的主要玩家。

 

Figure 創立於2022年,其團隊由來自特斯拉(Tesla)、Google DeepMind、波士頓動力(Boston Dynamics)等的AI與機械人專家所組成。(圖片來源:Figure官網)

 

  更重要的是,Figure藉此跟OpenAI達成合作協議,共同開發下一代人形機械人的AI模型。這意味著Figure機械人將會使用OpenAI旗下的GPT大型語言模型、DALL-E圖像生成模型、以至Sora影片生成模型。OpenAI產品及合作夥伴關係副總裁彼得‧韋林德(Peter Welinder)表示,該公司一直計劃重返機械人技術領域,現在Figure讓他們看到人形機械人結合大型語言模型後可以實現甚麼。

 

Figure機械人理解說話背後意圖

 

  宣布獲得OpenAI投資的十幾天後,Figure於3月14日發表首段採用OpenAI模型的機械人示範影片。測試人員向代號為「Figure 01」的機械人表示:「我可以吃點東西嗎?」它回答說:「當然可以」,然後就拿起枱面上的蘋果遞給測試人員。接著測試人員詢問Figure 01,為甚麼要這樣做,它回應道:「這是我唯一能拿給你吃的東西」。

 

  這代表著Figure 01能夠理解測試人員說話背後蘊含的意圖,進而與人類進行完整的對話。即使測試人員下達的指示不夠具體,但它也能透過視像鏡頭所看到的東西,再加上對說話指示的理解與推理後,順利完成任務。由此可見,它可以跟人類作出有意義的互動,這使得它比以往的機械人更為實用。

 

在OpenAI模型加持下,Figure 01機械人能夠完全聽從人類的指示,包括:把蘋果遞給人類、將垃圾收拾進框子、並把杯子和盤子放回瀝水架上。(圖片來源:翻攝Figure官方YouTube影片)

 

測試人員要求Figure 01機械人幫忙沖咖啡:它打開咖啡機的蓋子,將咖啡膠囊放進咖啡機裡;一旦發現咖啡膠囊沒有放對位置,Figure 01會伸手將咖啡膠囊擺正。(圖片來源:翻攝Figure官方YouTube影片)

 

AI機械人幫助緩解勞動力短缺

 

  Figure創辦人兼執行長布雷特·阿德考克(Brett Adcock)解釋指,Figure 01的視像鏡頭背後有OpenAI訓練的大型視覺語言模型(Vision-Language Model)進行影像分析。因此,它具備觀察學習能力,可以透過觀看人類行為來理解和完成任務。如果將Figure 01引進到工廠,就能夠執行不適合人類的危險或繁瑣工作,這將有助於紓緩全球勞動力不足的問題。

 

  隨著愈來愈多國家呈現人口老化、勞動人口下滑,人力短缺現象只會愈趨嚴重。國際顧問公司Korn Ferry評估,及至2030年全球將面對逾8,500萬人的人手短缺,令到全球產值每年損失8.5兆美元(約66.3兆港元)。AI機械人的出現,正可以填補這個缺口。高盛(Goldman Sachs)預測,未來10至15年內,人形機械人市場規模有望達到60億美元(約468億港元)以上。

 

OpenAI四出投資機械人初創

 

  其實,Figure已於2024年1月跟德國車廠BMW簽署合作協議,Figure機械人在未來12至24個月接受特定任務訓練後,將被部署到BMW的汽車生產線上。如今Figure獲得OpenAI的視覺語言模型與新一輪融資資金,將加速其人形機械人的研發,以投入到製造、運輸、物流及倉儲等不同領域,協助緩解產業缺工。

 

  除Figure之外,OpenAI曾於2023年3月領投挪威機械人初創1X Technologies,替其完成2,350萬美元(約1.83億港元)的A2輪融資,用於開發處理日常家務的雙足機械人NEO。2024年3月,OpenAI再投資另一機械人初創Physical Intelligence,助其完成7,000萬美元(約5.46億港元)的種子輪融資,目標是研發通用型AI機械人軟件系統,務求將同一套演算法應用到不同類型的機械人上。

 

  由此視之,OpenAI在稱霸生成式AI領域後,下一步將劍指AI機械人市場。倘若數碼世界的AI工具與現實世界的AI機械人均由OpenAI所主導,其AI霸權勢將變得牢不可破了!

 

02/09/2024

OpenAI神秘研發計劃曝光!Strawberry能力超越當今AI模型極限!可顛覆世人對AI技術認知?

#Smart Living #OpenAI #數碼轉型 #通用人工智能 #Sam Altman #AI #史丹福大學 #ChatGPT #規劃能力 #Strawberry #Q* #推理能力 #語言模型

  OpenAI曾於2023年底爆出宮鬥風波,執行長奧特曼一度被董事局罷免,有傳原因是他秘密研發一個可能會威脅人類的AI項目「Q*」,並已取得重大突破。當奧特曼復職後,此項目的研發代號改為「Strawberry」(士多啤梨),並繼續低調推進。近日有報道指,Strawberry或會在2024年秋季亮相,其能力更遠超當今所有AI模型!究竟它的誕生可以把AI技術引領到甚麼新境界?

 

OpenAI執行長奧特曼8月初在其X.com帳戶上傳了一張花園中栽種士多啤梨的照片,惹人無限遐想。(圖片來源:X.com@sama)

 

上網搜尋資料,自主採取行動

 

  科技網媒The Information引述消息人士指,OpenAI或許在2024年秋季發表代號「Strawberry」 的嶄新AI模型,更有望整合至ChatGPT。據說,Strawberry能夠解決現今大型語言模型無法應付的難題。譬如,它可以解開從沒見過的數學問題、協助擬定市場營銷策略、甚至破解複雜的文字解謎遊戲。此外,在常用於衡量AI模型數學能力的MATH基準測試中,Strawberry AI得分超過90%,遠勝GPT-4的53%與GPT-4o的76.6%。

 

  除回答用戶一般提問外,Strawberry更具備處理長期任務(Long-horizon Tasks)的能力。當面對複雜任務時,它不但懂得提前做好規劃,還可以在電腦代理程式(Computer-Using Agent,CUA)的幫助下自行上網搜尋資料,隨後更會依據搜尋結果採取行動,在較長一段時間內依靠CUA執行一系列相關操作。

 

透過後訓練強化AI理解能力

 

  OpenAI利用一個名為「深度研究」(Deep Research)的專門化數據集,替Strawberry進行「後訓練」(Post-training);換言之,其大型語言模型經過大量常識數據的預訓練(Pre-training),完成初步開發後,再以特定知識領域的數據進行後訓練,以強化它在專門領域的理解能力。為測試Strawberry的實際效果,OpenAI會用它來執行軟件與機器學習工程師的工作。

 

  其實,Strawberry的訓練方式類似美國史丹福大學(Stanford University)於2022年開發的「自學推理者」(Self-Taught Reasoner,STaR)。它透過反覆建立訓練數據來自我訓練,逐步提升AI模型的推理能力層級,藉此達到、甚至超越人類智慧的境界。STaR的開發者之一、史丹福大學教授諾亞·古德曼(Noah Goodman)接受傳媒訪問時直言,自己跟Strawberry無關,倘若它真的可以追上人類推理能力,那是讓人既興奮、又恐懼之事。

 

史丹福大學教授古德曼表示,STaR可以讓AI模型自我生成訓練數據,藉此引導自己進入更高的智能水平,理論上最終可以超越人類的智慧。(圖片來源:X.com@Stanford)

 

未來AI發展將經歷5級演進

 

  2024年7月11日,OpenAI發表對未來AI發展的構想,認為AI將會經歷5個層級的演進:

 

● 第一級:聊天機械人(Chatbots),具有一般對答能力的AI;

● 第二級:推理者(Reasoners),擁有人類水平解難能力的AI;

● 第三級:代理者(Agents),能夠採取實際行動的AI;

● 第四級:創新者(Innovators),可協助人類創新發明的AI;

● 第五級:組織者(Organizations),可以完成組織工作的AI。

 

  如此看來,ChatGPT正屬於第一級AI,而Strawberry很有可能是幫助OpenAI實現第二級AI的關鍵。OpenAI執行長山姆·奧特曼(Sam Altman)曾表示,AI領域最重要的演進將圍繞在推理能力之上。其他科技巨頭如Google、微軟(Microsoft),以至大部分從事AI研究的學術實驗室,都認為提升AI推理能力是解鎖大型語言模型潛力的關鍵。

 

OpenAI執行長奧特曼認為,在AI領域中最重要的技術演進就是推理能力的進步。(圖片來源:翻攝OpenAI官方YouTube影片)

 

新AI已交給美國國安官員審查

 

  不過,有另一派研究人員持有不同看法。圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)常說,驅動ChatGPT等AI工具的大型語言模型,永遠無法達到像人類般的推理和規劃能力,因為這類模型不了解物理世界,對邏輯的理解非常有限,所以無法根據任何合理的定義進行推理,也無法進行規劃。

 

  儘管外界對Strawberry議論紛紛,但OpenAI官方卻未有承認其存在,只表示「不斷研究新 AI 能是業界的常見做法,人們普遍相信AI系統的推理能力會隨著時間演進而提升。」事實上,Strawberry的開發正好符合OpenAI的使命:創建比人類更聰明的「通用人工智能」(Artificial General Intelligence,AGI),造福全人類。The Information透露,Strawberry現已提交給美國國家安全官員進行審查,預計將於2024年秋季某個時候面世。

 

OpenAI成立的使命是,研製通用人工智能,藉此造福人類。(圖片來源:Unsplash圖庫)

 

克服AI推理能力局限關鍵項目

 

  Strawberry是否真的會在2024年內推出尚未確定,外界估計OpenAI可能會先釋出原始模型的精煉版本,能以較低運算力實現相近的AI能力。另有消息指,OpenAI正在研發比GPT-4更強的新一代模型,開發代號為「Orion」;Strawberry負責生成高質數據給Orion進行訓練,藉此降低後者的回答出錯率。

 

  Strawberry的前身「Q*」曾被視為可能會威脅人類,更被認為是董事會決定踢走奧特曼的導火線。但隨著奧特曼閃電回巢,Strawberry不僅成為OpenAI克服AI推理能力局限的關鍵項目,更是開發次世代大型語言模型的幕後推手,重要性已顯得無以復加。一旦Strawberry成功了,將會重新定義AI的能力——能夠發掘重大科學發現、開發前所未見新型軟件,並自主執行複雜任務,那麼人類離AGI又進一步了!

 

#食譜 #素食 #數碼營銷 #電影 #移民 #減肥 #創科 #Netflix #外賣 #辦公室貼士 #疫情 #在家運動 #WFH #抗疫不悶 #限聚令 #辦公室求生術
more on etnet.com.hk