華南理工大學發(fā)布新成果 AI不僅能譯古文還會斷句

來源：科技日報葉青,華軒2023-11-07

分享到 :

核心提示：科技日報訊（記者葉青通訊員華軒）古籍文獻是中國傳統(tǒng)文化的載體，但由于語言的演變，理解古籍文獻的難度較大。11月4日，記者從華南理工大學獲悉，該校電子與信息學院金

科技日報訊（記者葉青通訊員華軒）古籍文獻是中國傳統(tǒng)文化的載體，但由于語言的演變，理解古籍文獻的難度較大。11月4日，記者從華南理工大學獲悉，該校電子與信息學院金連文教授所在的“深度學習與視覺計算實驗室”近日發(fā)布了通古大模型、古籍文檔分析與識別系統(tǒng)、彝文文檔分析識別系統(tǒng)等多項成果，借助人工智能（AI）技術(shù)讓古籍更易讀懂，為中國古籍文物數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、智能化開發(fā)與利用提供了技術(shù)支撐。

據(jù)介紹，團隊憑借在古籍領(lǐng)域長期積累的豐富大數(shù)據(jù)資源，加以自動生成的對話模板，通過大模型指令微調(diào)技術(shù)訓練，構(gòu)建出數(shù)字人文模型“通古大模型”。該大模型可智能實現(xiàn)文白翻譯、句讀標點和古籍檢索等功能，有助于讓大眾更便捷地了解中華傳統(tǒng)文化。

團隊還開發(fā)出古籍文檔分析與識別系統(tǒng)，該系統(tǒng)集成了團隊自主研發(fā)的古籍句讀和文本翻譯兩大功能。用戶只需提供一張古籍圖片，系統(tǒng)就能自動定位并識別其中所有的文本，將識別出的文本按照正確的閱讀順序排序，隨后為其添加標點符號并將之翻譯為白話文。

“我們進行了算法優(yōu)化，使古籍文檔分析與識別系統(tǒng)能夠應(yīng)對現(xiàn)實場景中古籍文檔可能出現(xiàn)的諸如書本彎曲、傾斜、文字密集以及圖片分辨率低等各種挑戰(zhàn)?！苯疬B文介紹，該系統(tǒng)兼具實用性和穩(wěn)健性，為推動古籍數(shù)字化工作提供了有力支持。

此外，團隊還開發(fā)了彝文文檔分析識別系統(tǒng)，該系統(tǒng)能自動精確定位并辨識圖片中的彝文文字。該識別系統(tǒng)采用的彝文編碼，基于團隊今年早些時候與上海大學、上海合合信息科技股份有限公司聯(lián)合發(fā)布的業(yè)界首個古彝文基礎(chǔ)編碼數(shù)據(jù)庫打造。

(編輯：月兒)

返回315記者攝影家首頁>>

相關(guān)閱讀：華南理工大學新成果 AI譯古文會斷句

“AI+作業(yè)”下沉到中學課堂教育如何適應(yīng)AI時代2024-04-15
AI“復活”引發(fā)科技倫理邊界討論2024-04-12
防范“AI換臉”詐騙行為2024-04-12
一個AI會員價格可買5個視頻會員，貴得有理？2024-04-12
AI心理推斷能力或與人類相當但不意味著它們有像人那樣的情商2024-05-23

關(guān)閉窗口

[責任編輯: 315xwsy_susan]

免責聲明：

1、本網(wǎng)內(nèi)容凡注明"來源：315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料，版權(quán)均屬315記者攝影家網(wǎng)所有，轉(zhuǎn)載、下載須通知本網(wǎng)授權(quán)，不得商用，在轉(zhuǎn)載時必須注明"稿件來源：315記者攝影家網(wǎng)"，違者本網(wǎng)將依法追究責任。
2、本文系本網(wǎng)編輯轉(zhuǎn)載，轉(zhuǎn)載出于研究學習之目的，為北京正念正心國學文化研究院藝術(shù)學研究、宗教學研究、教育學研究、文學研究、新聞學與傳播學研究、考古學研究的研究員研究學習，并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3、如涉及作品、圖片等內(nèi)容、版權(quán)和其它問題，請作者看到后一周內(nèi)來電或來函聯(lián)系刪除。