《經濟通通訊社25日專訊》內地人工智能初創DeepSeek本周低調發布V3模型更
新,並保持開源和免費風格。綜合DeepSeek介紹、內地傳媒和海外用戶分析,
DeepSeek V3並非推理模型,但採用具有6710億參數的專家混合模型(MoE)
,激活參數370億,並且主要集中在編程能力提升。
3月24日(周一)晚,DeepSeek在Hugging Face網站上傳了V3-
0324更新,未進行正式公告。該版本聲稱可以解決現實世界的挑戰,同時在準確性和效率方
面設立新標準。根據開源評測平台kcores-llm-arena測試數據,
DeepSeek V3-0324的程式碼能力達到328﹒3分,更勝DeepSeek-
R1、OpenAI-o1、普通版Claude 3﹒7 Sonnet,接近Claude
3﹒7 Sonnet思維鏈版本的334﹒8分。
DeepSeek今年1月成為蘋果美國應用商店最受歡迎的免費應用,其較低開發成本的
AI模型R1被認為能力可與OpenAI的最強模型媲美,引發市場重新審視巨資建設算力的
必要性,引發美國科技股拋售。(ry)
《說說心理話》遺體修復師分享入行過程!初入行有冇心理壓力?「無言老師」計劃推行初衷?► 即睇