百度智能雲針對Ｍｅｔａ　Ｌｌａｍａ　３大模型推出訓練推理方案

19/04/2024 16:11

　　《經濟通通訊社１９日專訊》據內媒報道，百度（０９８８８）智能雲千帆大模型平台推出針對Ｌｌａｍａ　３全系列版本的訓練推理方案，便於開發者進行再訓練，搭建專屬大模型，現已開放邀約測試。百度智能雲為內地首家大模型企業推出支持Ｌｌａｍａ　３的訓練推理方案。　　目前百度智能雲千帆大模型平台中各種尺寸模型訂製工具ＭｏｄｅｌＢｕｉｌｄｅｒ，已預置了最全面最豐富的大模型，支持國內外第三方主流模型，總數量達到７９個，是國內擁有大模型數量最多的開發平台。　＊Ｌｌａｍａ　３性能或達到ＧＰＴ－４級別＊　　　Ｌｌａｍａ　３是Ｍｅｔａ於１８日正式發布的多模態開源大模型，參數有８Ｂ和７０Ｂ兩種，供外部開發者免費使用。未來幾個月，Ｍｅｔａ將陸續推出一系列具備多模態、多語言對話、更長上下文窗口等能力的新模型。其中，４００Ｂ參數的有望與ＯｐｅｎＡＩ最強對手Ａｎｔｈｒｏｐｉｃ的Ｃｌａｕｄｅ　３一較高下。　　Ｍｅｔａ號稱，Ｌｌａｍａ　３　８Ｂ和７０Ｂ是目前同體量下性能最好的開源大模型。ＯｐｅｎＡＩ創始成員之一、特斯拉前ＡＩ總監Ａｎｄｒｅｊ　Ｋａｒｐａｔｈｙ認同，並認為Ｌｌａｍａ　３　４００Ｂ的性能可能達到ＧＰＴ－４級別。　　據介紹，與Ｌｌａｍａ　２相比，Ｌｌａｍａ　３使用了１５Ｔ　ｔｏｋｅｎｓ的訓練數據，在推理、數學、代碼生成、指令跟蹤等能力獲得大幅度提升。此外，Ｌｌａｍａ　３還使用了分組查詢注意力、掩碼等創新技術，幫助開發者以最低的能耗獲取絕佳的性能。　　Ｍｅｔａ首席執行官朱克伯格表示，基於最新的Ｌｌａｍａ　３模型，Ｍｅｔａ　ＡＩ助手現已覆蓋Ｉｎｓｔａｇｒａｍ、ＷｈａｔｓＡｐｐ、Ｆａｃｅｂｏｏｋ等全系應用，並單獨開啟了網站；該助手可以回答問題、製作動畫和生成圖像。朱克伯格還稱，Ｍｅｔａ的目標不是與開源模型競爭，而是要超過所有人，打造最領先的人工智能。Ｍｅｔａ團隊將會公布Ｌｌａｍａ　３的技術報告，披露模型更多的細節。（ｓｌ）

【你點睇？】以伊衝突升級，北韓派兵增援俄羅斯，你會否擔心世界發生大規模戰爭？► 立即投票

百度智能雲針對Ｍｅｔａ Ｌｌａｍａ ３大模型推出訓練推理方案

百度智能雲針對Ｍｅｔａ　Ｌｌａｍａ　３大模型推出訓練推理方案