《經濟通通訊社19日專訊》據內媒報道,百度(09888)智能雲千帆大模型平台推出
針對Llama 3全系列版本的訓練推理方案,便於開發者進行再訓練,搭建專屬大模型,現
已開放邀約測試。百度智能雲為內地首家大模型企業推出支持Llama 3的訓練推理方案。
目前百度智能雲千帆大模型平台中各種尺寸模型訂製工具ModelBuilder,已預
置了最全面最豐富的大模型,支持國內外第三方主流模型,總數量達到79個,是國內擁有大模
型數量最多的開發平台。
*Llama 3性能或達到GPT-4級別*
Llama 3是Meta於18日正式發布的多模態開源大模型,參數有8B和70B兩
種,供外部開發者免費使用。未來幾個月,Meta將陸續推出一系列具備多模態、多語言對話
、更長上下文窗口等能力的新模型。其中,400B參數的有望與OpenAI最強對手
Anthropic的Claude 3一較高下。
Meta號稱,Llama 3 8B和70B是目前同體量下性能最好的開源大模型。
OpenAI創始成員之一、特斯拉前AI總監Andrej Karpathy認同,並認為
Llama 3 400B的性能可能達到GPT-4級別。
據介紹,與Llama 2相比,Llama 3使用了15T tokens的訓練數據
,在推理、數學、代碼生成、指令跟蹤等能力獲得大幅度提升。此外,Llama 3還使用了
分組查詢注意力、掩碼等創新技術,幫助開發者以最低的能耗獲取絕佳的性能。
Meta首席執行官朱克伯格表示,基於最新的Llama 3模型,Meta AI助手
現已覆蓋Instagram、WhatsApp、Facebook等全系應用,並單獨開啟
了網站;該助手可以回答問題、製作動畫和生成圖像。朱克伯格還稱,Meta的目標不是與開
源模型競爭,而是要超過所有人,打造最領先的人工智能。Meta團隊將會公布Llama
3的技術報告,披露模型更多的細節。(sl)
【你點睇?】以伊衝突升級,北韓派兵增援俄羅斯,你會否擔心世界發生大規模戰爭?► 立即投票