中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點… | 內地 - 香港中通社

2025年04月02日星期三繁简

首頁 -> 內地

中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點…

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2023-12-13 10:57 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網12月13日電據南京農業大學網站消息，12月2日，該校信息管理科學系王東波教授研究團隊在北京發佈“荀子”古籍大語言模型。“荀子”古籍大語言模型是在國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”的支持下，聯合中華書局古聯公司推出的專門進行古籍處理與研究的智能工具。該模型包含《四庫全書》在內的絕大多數傳世古籍文獻，擁有超過20億字的大型語料庫。

“荀子”古籍大語言模型以古籍智能化研究為目的，為古籍智能處理而設計，在推動中國古籍研究與保護工作創新發展、提高中華傳統文化傳承的效率與質量、實現大語言模型與古籍處理的深度融合上提供重要支撐。該模型作為開源公益研究成果已在GitHub、ModelScope等網站發佈，用戶可免費下載部署使用。

據介紹，王東波教授研究團隊在南京農業大學高算力基礎設施支持下，持續10年深耕古籍文獻數字化研究，同時依托中華書局提供的應用場景，在古籍開源大語言模型上實現AI人工智能垂直細分領域的全國首創。

該開源模型包括兩個部分：基座模型XunziALLM與對話模型XunziChat。

其模型亮點包括：智能標引，能夠對古籍中的內容進行高質量主題標引，幫助研究人員快速了解文章主題；

信息抽取，能夠自動從古籍中抽取關鍵信息，如人物、事件、地點等，大大節省了信息整理時間；

詩歌生成，能夠根據給定的主題或關鍵詞，自動生成符合語法規則和韻律要求的古詩，為詩詞愛好者提供創作靈感；

高質量翻譯，對於難以理解的古籍文獻，能夠進行精準的現代文翻譯，幫助研究人員更好地理解原文含義；

閱讀理解，能夠對給出的古文文本進行分析解釋，實現對古籍文本的自動閱讀；

詞法分析，可以完成古籍文本的自動分詞和詞性標註，有效提升研究效率；

自動標點，可以快速完成古籍文本的斷句和標點，提升使用者對古籍文本的閱讀體驗。

此外，同時發佈的基座模型，用戶也可以根據自己的需求，使用本地的訓練語料微調“荀子”基座模型，使其在古籍下遊處理任務上取得更優越的處理性能。（完）

【編輯：丘志彬】

相關新聞

港大深圳醫院部署AI大模型助力醫療智能化發展

葉嘉瑩逝世巴金誕辰紀念華人憶文學巨匠

特稿：歌德故居“北京廳”和他的中國情結

2024“全球觀家國情”粵港澳外語與翻譯研究生學術交流周成功舉辦

北京見聞：科技融入生活　北京“未來感”圖書館走紅

漢語盤點2023”發佈中國年度十大流行語、十大網絡用語、十大新詞語

中國發布十大新詞語“村超”等入選

城市大學舉辦書藝同行展呈現圖書館裡的中韓人文交流史

台“自研”AI抄襲大陸成果？台“中研院”院長辯稱“研究員求快心切”

台“自研”AI語言模型答問顯示“台灣屬於中國”

【來論】洪錦鉉：知道“茶”字的起源嗎？

“腹有詩書——全港小學校際中國語文常識問答比賽”英華小學蟬聯冠軍

視頻

更多

【通講壇】東部戰區開展聯合演訓，背後有這三點考量？

鄧炳強：感動市民明白維護國安重要性　現時香港仍面臨四大國安風險

22年的懷念　歌迷永遠寵愛張國榮

東江水供港60年　李家超：是國家與香港血濃於水的深情典範

中國發展高層論壇剛結束　這家跨國企業就宣布在香港投資3億

香港七人欖球賽2025　超11萬次觀眾入場　遊客大讚香港是最棒的！

記者帶你走一圈！看首次於香港啟德體育園舉辦的七欖氣氛如何？

來論

更多

論壇

更多

圖集

更多

周一鳴獲委任為香港警務處處長

“文化推廣大使”譚盾在香港介紹“譚盾WE-音樂節”演出計劃

“大國長安——粵港澳優秀動漫插畫展”在香港舉行開幕式

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453