《ＡＩ熱潮》騰訊推出參數規模最大的開源ＭｏＥ大語言模型

06/11/2024 08:54

　　《經濟通通訊社６日專訊》騰訊（００７００）宣布推出業界參數規模最大、效果最好的開源ＭｏＥ大語言模型Ｈｕｎｙｕａｎ－Ｌａｒｇｅ。　　此外，騰訊還宣布將推出自研的長文評測集「企鵝卷軸」（ＰｅｎｇｕｉｎＳｃｒｏｌｌｓ），以填補行業在真實長文評測集上的空白。企鵝卷軸基於公開的金融、法律、學術論文等長文本構建，文本長度從１Ｋ到１２８Ｋ不等，覆蓋深度閱讀理解和長文推理任務。　＊Ｈｕｎｙｕａｎ－Ｌａｒｇｅ超越一流開源模型＊　　　Ｈｕａｎｙｕａｎ－ｌａｒｇｅ模型的總參數量為３８９Ｂ、激活參數為５２Ｂ、訓練ｔｏｋｅｎ數量為７Ｔ、最大上下文長度為２５６Ｋ、詞表大小為１２﹒８ｗ。　　在技術創新方面，Ｈｕｎｙｕａｎ－ｌａｒｇｅ通過高質量的合成數據來增強模型訓練，彌補了自然數據的不足。　　其中，該模型預訓練支持處理高達２５６Ｋ的文本序列，大幅提升了長文本上下文的處理能力，能夠更高效地完成長文本任務。　　據了解，Ｈｕｎｙｕａｎ－ｌａｒｇｅ在ＣＭＭＬＵ、ＭＭＬＵ、ＣＥｖａ１、ＭＡＴＨ等多學科綜合評測集上表現優異，在中英文自然語言處理、代碼生成、數學運算等９大能力維度中全面領先，超越了Ｌｌａｍａ３﹒１和Ｍｉｘｔｒａｌ等一流開源模型。（ｃｔ）

第九屆「傳媒轉型大獎」請投etnet經濟通一票！ ► 立即行動

《ＡＩ熱潮》騰訊推出參數規模最大的開源ＭｏＥ大語言模型

【大行炒Ｄ乜】小米手機銷情佳大行讚好，中信里昂調高兩內險目標 06/11/2024 08:58

《盤前攻略》特朗普贏面偏大美股報升，密切留意港股資金流向 06/11/2024 08:51

其他相關新聞

林世雄：低空經濟大有可為，必需與大灣區互聯互通 06/11/2024 09:08

《大手成交》中國生物製藥三手共三千萬股市前交易，涉１﹒２４億 06/11/2024 09:05

小米１５熱賣斷貨，天貓雙１１銷售在國產機領域居冠 06/11/2024 09:03

上市公司通告摘要一覽（６） 06/11/2024 08:45

上市公司通告摘要一覽（３） 06/11/2024 08:45