新聞中心

EEPW首頁 > 國際視野 > 業(yè)界動態(tài) > 俄科學(xué)家用人工智能破譯古代典籍

俄科學(xué)家用人工智能破譯古代典籍

作者:環(huán)球時報 時間:2022-09-20 來源:新浪網(wǎng) 收藏

【環(huán)球時報綜合報道】科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏有藏文和蒙文古文獻(xiàn)十余萬冊,稱得上是古代智慧寶庫,但其中只有一小部分文字被翻譯成俄文。目前,該研究所東方手寫文獻(xiàn)和刻本研究中心的科學(xué)家已開始破譯這些古代典籍,他們使用了系統(tǒng)。

本文引用地址:http://m.butianyuan.cn/article/202209/438373.htm

  教系統(tǒng)“閱讀”

  “目前,我們正教系統(tǒng)閱讀藏文”,該研究所所長巴扎羅夫(Boris Bazarov)院士介紹說,“為此掃描了500頁手稿和刻本(木刻板印刷古代書籍),然后通過使用將藏文轉(zhuǎn)換為拉丁字母的威利(Wylie)系統(tǒng)手動輸入拉丁字母?!边@500頁文獻(xiàn)成為神經(jīng)網(wǎng)絡(luò)“教材”,程序員教神經(jīng)網(wǎng)絡(luò)記住圖像并將其與隨附文本相關(guān)聯(lián)。培訓(xùn)只用了2個小時,神經(jīng)網(wǎng)絡(luò)就通過了考試,已能以94%的準(zhǔn)確率識別藏文。不過,科學(xué)家們并不滿足于此。

  “藏文文字特點在于音節(jié)文字,而非字母”,東方手寫文獻(xiàn)研究中心主任林奇諾夫(Oleg Rinchinov)說,“刻本與其他文獻(xiàn)的不同之處在于多相性——有的地方刻得比較清晰,有的地方刻得比較模糊。而且,這些文獻(xiàn)還受到歲月蠶食。目前,還沒有達(dá)到文本識別的最高準(zhǔn)確率。”科學(xué)家認(rèn)為,可將準(zhǔn)確率提高到99%,但每提高一個百分點都需要大量細(xì)致的工作,例如要將準(zhǔn)確率提高到95%,需要多用上千個示例“教”神經(jīng)網(wǎng)絡(luò),準(zhǔn)確率從95%提高到96%則需要用上萬個示例。因此,該項目至少延長了5年。相比之下,一個藏學(xué)家翻譯一部作品需要3年到10年。

  古代智慧寶庫前景廣闊

  “這是世界上首次嘗試解譯藏文”,巴扎羅夫院士介紹說,“翻譯典章和醫(yī)學(xué)文獻(xiàn)等可以更充分地了解古代知識,而且使大量材料得以通用。盡管該項目延期,但我們的所有努力都是為了提高文本識別的準(zhǔn)確性。之后,我們借助神經(jīng)網(wǎng)絡(luò)就能輕松地將原始文獻(xiàn)翻譯成其他語言了?!?/p>

  科學(xué)院院長謝爾蓋耶夫(Alexandr Sergeev)和科學(xué)院西伯利亞分院院長帕爾蒙(Valentin Parmon)不僅從文化角度,還從實踐角度對古代智慧寶庫的前景予以高度評價,他們認(rèn)為,醫(yī)學(xué)書籍中的處方可用來制作生物活性添加劑,還可以制藥,這對在布里亞特共和國建立生物醫(yī)學(xué)產(chǎn)業(yè)集群尤其具有現(xiàn)實意義。

  中國藥學(xué)家的啟示

  “2015年中國藥學(xué)家屠呦呦因發(fā)現(xiàn)治療瘧疾的新藥獲得諾貝爾獎。這種藥是從青蒿中提取的,可以有效降低瘧疾患者的死亡率”,巴扎羅夫舉了一個現(xiàn)代人使用古代知識的鮮活例子,“藏族智慧還包含多少造福人類的發(fā)明?我們很快就會知道。我們發(fā)明這個算法,實現(xiàn)系統(tǒng)工作穩(wěn)定后,一定會開始破譯古蒙古文文獻(xiàn)。我相信,我們在這方面也會取得科學(xué)突破?!彼f。

  俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏的古代藏文和蒙古文典籍、檔案文件、音頻、照片和視頻屬全球最大規(guī)模之一。這些稀有珍品收集了上百年。藏品中有十多萬冊藏文典籍和7000冊古蒙古文文獻(xiàn),包括哲學(xué)、醫(yī)學(xué)和宗教文學(xué)。最古老的文獻(xiàn)可以追溯到16世紀(jì)。這些珍品中有約170部獨立醫(yī)學(xué)著作,涉及冥想方法、針刺療法、外科手術(shù)和藥理學(xué),其中只有10%被譯成了俄語。




關(guān)鍵詞: 俄羅斯 人工智能 考古

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉