應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

南京農(nóng)業(yè)大學(xué)研發(fā)全國首個(gè)古籍 AI 大模型“荀子”:能吟詩、提供高質(zhì)量翻譯

2023-12-15 09:35 IT之家
關(guān)鍵詞:AI大模型

導(dǎo)讀:據(jù)“南京農(nóng)業(yè)大學(xué)校友會(huì)”官方公眾號,近日,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授研究團(tuán)隊(duì)在北京發(fā)布“荀子”古籍大語言模型。

  據(jù)“南京農(nóng)業(yè)大學(xué)校友會(huì)”官方公眾號,近日,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授研究團(tuán)隊(duì)在北京發(fā)布“荀子”古籍大語言模型。

image.png

  據(jù)介紹,“荀子”大模型包含《四庫全書》在內(nèi)的絕大多數(shù)傳世古籍文獻(xiàn),擁有超過 20 億字的大型語料庫,是該校團(tuán)隊(duì)在國家社科基金重大項(xiàng)目“中國古代典籍跨語言知識庫構(gòu)建及應(yīng)用研究”的支持下,聯(lián)合中華書局古聯(lián)公司推出的專門進(jìn)行古籍處理與研究的智能工具。

  南京農(nóng)業(yè)大學(xué)表示,該模型擁有如下亮點(diǎn):

  • 智能標(biāo)引:能夠?qū)偶械膬?nèi)容進(jìn)行高質(zhì)量主題標(biāo)引,幫助研究人員快速了解文章主題;

  • 信息抽取:能夠自動(dòng)從古籍中抽取關(guān)鍵信息,如人物、事件、地點(diǎn)等,大大節(jié)省了信息整理時(shí)間;

  • 詩歌生成:能夠根據(jù)給定的主題或關(guān)鍵詞,自動(dòng)生成符合語法規(guī)則和韻律要求的古詩,為詩詞愛好者提供創(chuàng)作靈感;

  • 高質(zhì)量翻譯:對于難以理解的古籍文獻(xiàn),能夠進(jìn)行精準(zhǔn)的現(xiàn)代文翻譯,幫助研究人員更好地理解原文含義;

  • 閱讀理解:能夠?qū)o出的古文文本進(jìn)行分析解釋,實(shí)現(xiàn)對古籍文本的自動(dòng)閱讀;

  • 詞法分析:可以完成古籍文本的自動(dòng)分詞和詞性標(biāo)注,有效提升研究效率;

  • 自動(dòng)標(biāo)點(diǎn):可以快速完成古籍文本的斷句和標(biāo)點(diǎn),提升使用者對古籍文本的閱讀體驗(yàn)。

  該模型包含基座模型 XunziALLM 和對話模型 XunziChat 兩部分,用戶還可根據(jù)自己的需求使用本地訓(xùn)練語料微調(diào)基座模型,從而使其在古籍下游處理任務(wù)上取得更優(yōu)越的處理性能。