19/04/2024 16:11
百度智能雲針對Meta Llama 3大模型推出訓練推理方案
《經濟通通訊社19日專訊》據內媒報道,百度(09888)智能雲千帆大模型平台推出針對Llama 3全系列版本的訓練推理方案,便於開發者進行再訓練,搭建專屬大模型,現已開放邀約測試。百度智能雲為內地首家大模型企業推出支持Llama 3的訓練推理方案。 目前百度智能雲千帆大模型平台中各種尺寸模型訂製工具ModelBuilder,已預置了最全面最豐富的大模型,支持國內外第三方主流模型,總數量達到79個,是國內擁有大模型數量最多的開發平台。 *Llama 3性能或達到GPT-4級別* Llama 3是Meta於18日正式發布的多模態開源大模型,參數有8B和70B兩種,供外部開發者免費使用。未來幾個月,Meta將陸續推出一系列具備多模態、多語言對話、更長上下文窗口等能力的新模型。其中,400B參數的有望與OpenAI最強對手Anthropic的Claude 3一較高下。 Meta號稱,Llama 3 8B和70B是目前同體量下性能最好的開源大模型。OpenAI創始成員之一、特斯拉前AI總監Andrej Karpathy認同,並認為Llama 3 400B的性能可能達到GPT-4級別。 據介紹,與Llama 2相比,Llama 3使用了15T tokens的訓練數據,在推理、數學、代碼生成、指令跟蹤等能力獲得大幅度提升。此外,Llama 3還使用了分組查詢注意力、掩碼等創新技術,幫助開發者以最低的能耗獲取絕佳的性能。 Meta首席執行官朱克伯格表示,基於最新的Llama 3模型,Meta AI助手現已覆蓋Instagram、WhatsApp、Facebook等全系應用,並單獨開啟了網站;該助手可以回答問題、製作動畫和生成圖像。朱克伯格還稱,Meta的目標不是與開源模型競爭,而是要超過所有人,打造最領先的人工智能。Meta團隊將會公布Llama 3的技術報告,披露模型更多的細節。(sl)
【你點睇?】以伊衝突升級,北韓派兵增援俄羅斯,你會否擔心世界發生大規模戰爭?► 立即投票