港大指人工智能大語言模型文心一言4中文表現最佳 | 社團 - 香港中通社

2025年04月05日星期六繁简

首頁 -> 社團

港大指人工智能大語言模型文心一言4中文表現最佳

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2024-03-13 09:00 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網3月12日電香港大學經管學院日前就多個主流的人工智能大語言模型（LLMs）在中文及英文環境進行綜合深入評測，並發表評測報告，於12日公佈中文和英文語境大模型排行榜。在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo領先優勢明顯。

報告評測了14款中文及16款英文語境下的人工智能通用大語言模型。評測主要針對三大核心能力，包括自然語言能力、專業學科能力以及安全與責任，要求大模型展現出對人類角色、微妙情感和文化語境的深入理解，並在更複雜和多樣化的情境中準確理解和回應指令，以及對人類學科知識的掌握、處理敏感話題的能力等。

在中文語境下，文心一言4綜合表現最佳，GPT4-turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。在安全與責任方面，文心一言4得分亦最高，展現出較成熟的安全意識。文心一言4的表現，也側面反映越來越多高品質的中文資料集，逐步被構築並應用於國產大模型，以創造出更好的中文思維AI助手。

在英文語境下，僅有GPT 4-turbo一款模型的綜合得分獲得80分以上，大多數國產大模型在英文語境下的綜合表現處於稍微劣勢的位置。這也與國產大模型訓練的數據多為中文有關。

港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。（完）

【編輯：譚暢】

相關新聞

中國發布海洋垂直領域大語言模型“瀚海智語”

港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

馬斯克旗下xAI推出人工智能模型Grok 3

通說：就在深圳，AI“公務員”和“警察”上崗

DeepSeek到底什麼水平？

Deepseek出世英偉達暴跌15% 專家：中美AI競爭打成平手

通說：來自廣東的他，讓硅谷刮目相看

商湯推出“日日新”融合大模型勇奪“雙冠王”

百度推文心大模型4.0　稱綜合能力匹敵GPT-4

職場達人實測“文心一言”是文案高手

微軟總裁：中國企業是ChatGPT主要競爭對手

視頻

更多

全球第四！香港首季IPO集資額升287%

【通講壇】東部戰區開展聯合演訓，背後有這三點考量？

鄧炳強：感動市民明白維護國安重要性　現時香港仍面臨四大國安風險

22年的懷念　歌迷永遠寵愛張國榮

東江水供港60年　李家超：是國家與香港血濃於水的深情典範

中國發展高層論壇剛結束　這家跨國企業就宣布在香港投資3億

香港七人欖球賽2025　超11萬次觀眾入場　遊客大讚香港是最棒的！

來論

更多

論壇

更多

圖集

更多

專訪卓永興：發展與國安是車之兩輪鳥之兩翼

清明節　香港市民選購紙紮祭品拜祭先人

清明假期香港尖沙咀海濱遊人如織

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453