全日新聞  |  
重點新聞  |  
中國要聞  |  
人民幣新聞  |  
美股新聞NEW  |  
A股  |  
大手異動  |  
大市分析  |  
大行報告  |  
外圍經濟  |  
經濟消息  |  
公司要聞  |  
業績公佈  |  
地產  |  
新股新聞  |  
窩輪新聞  |  
黃金外匯  |  
每日必讀  |  
推送新聞

12/03/2024 19:32

港大經管學院報告:文心一言4中文語境綜合表現最佳

  港大經管學院就多個主流的人工智能大語言模型(LLMs)在中文及英文環境進行綜合深入評測,並發表評測報告,在評測14款中文及16款英文語境下的人工智能通用大語言模型後,發現在中文語境下,文心一言4綜合表現最佳;而在英文語境下,GPT 4-turbo領先優勢明顯。
  是次評測主要針對三大核心能力,包括自然語言能力、專業學科能力以及安全與責任。在中文語境下,文心一言4綜合表現最佳,獲得74.58分,而GPT 4-Turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。
  在安全與責任方面,文心一言4得分亦最高,展現出較成熟的安全意識。文心一言4的表現,也側面反映愈來愈多高品質的中文資料集,逐步被構築並應用於國產大模型,以創造出更好的中文思維AI助手。
  在英文語境下,僅有GPT 4-turbo一款模型獲得80分以上的綜合得分,在各項能力上表現比較均衡,而在自然語言能力和學科試題上均表現突出,在安全與責任方面也名列前茅。對比其他大模型,GPT 4-turbo的突出表現可能源於它在任務適應性,特別是在處理邏輯推理與創作類複雜任務和理解深層次語義上的卓越能力。
  港大經管學院創新及資訊管理學教授蔣鎮輝表示,中國具有大語言模型應用的豐富場景,特別是在教育、金融、醫療、法律、零售等方面,未來的想像空間十分寬廣。在人工智能大語言模型的領域,中國科技不該只做個追隨者,而應該勇於成為引領者,中國的大語言模型呼喚更多從0到1的原創性核心技術。
《經濟通通訊社12日專訊》

《說說心理話》親友自殺離世遺屬如何自處?身邊親友應該怎樣陪他們走出人生最低谷?► 即睇

緊貼市況
  • 03888 金山軟件
  • 44.150
  • 01211 比亞迪股份
  • 348.800
  • 00291 華潤啤酒
  • 25.300
  • 02331 李寧
  • 16.320
  • 89988 阿里巴巴-WR
  • 113.000
  • 01833 平安好醫生
  • 7.900
  • 目標︰$8.50
  • 00386 中國石油化工股份
  • 4.290
  • 目標︰$5.20
  • 02318 中國平安
  • 47.000
  • 目標︰$51.00
  • 02899 紫金礦業
  • 15.880
  • 目標︰$18.00
  • 00941 中國移動
  • 80.700
  • 目標︰--
  • 09988 阿里巴巴-W
  • 121.300
  • 00700 騰訊控股
  • 492.800
  • 00388 香港交易所
  • 339.400
  • 00020 商湯-W
  • 1.810
  • 03690 美團-W
  • 168.000
  • 03393 威勝控股
  • 8.100
  • 目標︰--
  • 00772 閱文集團
  • 32.150
  • 目標︰$35.00
  • 01211 比亞迪股份
  • 348.800
  • 目標︰--
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 17/02/2025 14:29
中國指數之報價為即時更新,資料更新時間為 17/02/2025 14:29
期指之報價為即時更新,資料更新時間為 17/02/2025 14:29
緊貼市況之報價延遲最少15分鐘,資料更新時間為 17/02/2025 14:10
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞!

etnet榮獲第六屆國際信息商會議「最佳信息商」白金獎

etnet榮獲HKEX Awards 2023 「最佳證券數據供應商」大獎

貨幣攻略

大國博弈

說說心理話

Watch Trends 2024

北上食買玩

Art Month 2024

理財秘笈

流感高峰期

山今養生智慧

輕鬆護老