《ＡＩ熱潮》騰訊推出參數規模最大的開源ＭｏＥ大語言模型

06/11/2024 08:54

　　《經濟通通訊社６日專訊》騰訊（００７００）宣布推出業界參數規模最大、效果最好的開源ＭｏＥ大語言模型Ｈｕｎｙｕａｎ－Ｌａｒｇｅ。　　此外，騰訊還宣布將推出自研的長文評測集「企鵝卷軸」（ＰｅｎｇｕｉｎＳｃｒｏｌｌｓ），以填補行業在真實長文評測集上的空白。企鵝卷軸基於公開的金融、法律、學術論文等長文本構建，文本長度從１Ｋ到１２８Ｋ不等，覆蓋深度閱讀理解和長文推理任務。　＊Ｈｕｎｙｕａｎ－Ｌａｒｇｅ超越一流開源模型＊　　　Ｈｕａｎｙｕａｎ－ｌａｒｇｅ模型的總參數量為３８９Ｂ、激活參數為５２Ｂ、訓練ｔｏｋｅｎ數量為７Ｔ、最大上下文長度為２５６Ｋ、詞表大小為１２﹒８ｗ。　　在技術創新方面，Ｈｕｎｙｕａｎ－ｌａｒｇｅ通過高質量的合成數據來增強模型訓練，彌補了自然數據的不足。　　其中，該模型預訓練支持處理高達２５６Ｋ的文本序列，大幅提升了長文本上下文的處理能力，能夠更高效地完成長文本任務。　　據了解，Ｈｕｎｙｕａｎ－ｌａｒｇｅ在ＣＭＭＬＵ、ＭＭＬＵ、ＣＥｖａ１、ＭＡＴＨ等多學科綜合評測集上表現優異，在中英文自然語言處理、代碼生成、數學運算等９大能力維度中全面領先，超越了Ｌｌａｍａ３﹒１和Ｍｉｘｔｒａｌ等一流開源模型。（ｃｔ）

【你點睇】港鐵失倫敦伊利沙伯線專營權，你認為「國際化」遇挫的港鐵應否將重心轉移回本地？► 立即投票

《ＡＩ熱潮》騰訊推出參數規模最大的開源ＭｏＥ大語言模型

《中概異動》港股挫逾１５０點，平台股領跌京東走低超３％ 06/11/2024 10:07

《盤前攻略》特朗普贏面偏大美股報升，密切留意港股資金流向 06/11/2024 08:51

其他相關新聞

離岸人幣急貶恒指半日跌５４７點報２０４５９，僅兩藍籌上升 06/11/2024 12:06

《中國要聞》據報米哈游對阿里雲採購預算減近半，強化自建雲服務 06/11/2024 11:51

《神州金融》銀聯：境外發行銀聯卡全面支持綁定支付寶與微信支付 06/11/2024 11:03

恒指升４３９點收盤攻破兩萬一，科技、內需股衝前，中資金融報喜 05/11/2024 16:13

恒指隨Ａ股造好半日升２５５點報２０８２３，舜宇炒蘋概飆９％ 05/11/2024 12:06