為甲骨文研究插上科技的翅膀 帶你揭秘3000年前的那個王朝
甲骨文是商朝王室用于占卜記事而篆刻在龜甲和獸骨上的符號,距今約有3600多年的歷史,是迄今為止中國發現的年代最早的成熟文字系統,對專家學者研究商代歷史、文字發展史、中華文明起源具有極高的歷史價值、文化價值和藝術價值。
自殷商甲骨文出土以來,現已發現分布在海內外的甲骨約16萬片,共有單字4300多個,但目前取得共識的破譯字僅1500多個,還余下三分之二的未釋字,甲骨文考釋工作任重而道遠。
近日,CCTV-9紀錄頻道通過一部人文歷史系列紀錄片《甲骨王朝》,從文化疆域、社會生活、占卜制度、生產科技等多個方面,揭開了商王朝的神秘面紗,還原了商王朝的歷史面貌,也近距離地向觀眾展示了一段“特別的”甲骨文的考釋工作。

央視紀錄片《甲骨王朝》視頻畫面
一片甲骨驚天下 科技破解古文字蘊藏的文化密碼
甲骨文破譯的難點在于,經歷了數千年的歲月,商代社會與現代社會差異巨大,文字的形體、意義、讀音都發生了劇烈的變化,加上甲骨殘斷、拓片不清、語料缺乏等諸多因素,通過人工破譯甲骨文的難度大、耗時長。
同時,甲骨文獨體字中象形字占多數,并且“一字多形、一字多義”情況很多,辨識難度極大,工作十分繁重。如下面一組甲骨文:

甲骨文“龜”,出自《漢語詞典》(黃揚主編)
其實,上面的甲骨文都是同一個字,“龜”。在已破譯的甲骨文中,龜字有多種書寫方式——正視的、側視的;四只腳的、六只腳的……可謂五花八門,形態各異。甲骨文的研究真是既有趣又充滿挑戰。
要攻克甲骨文破譯這一學界的超級難題,新技術的跨界融合提供了新的思路。首都師范大學甲骨文研究中心莫伯峰教授聯手華為云AI工程師團隊,借助云計算、AI及大數據等技術力量打造了一系列提升甲骨文考釋效率的方案:基于華為云ModelArts一站式AI開發平臺等服務,雙方共同打造了甲骨文字形匹配、甲骨文語義推理兩個AI模型,從字形和語義的角度來輔助甲骨文的研究工作。
字形匹配模型 AI洞悉文字變遷的規律
甲骨拓片所呈現的內容可以理解為一篇記錄遠古時期祭祀、征伐、氣象、田游、卜夢等活動的短文。大至國家興衰,小至個人命運,都能在甲骨拓片中找出絲絲線索。因此,用“一個文字就是一段歷史”來形容甲骨文一點兒也不夸張。可是,未考釋的文字,對應的是一段歷史的空白。面對著穿越數千年而來的不會說話的象形文字,考釋工作該從何處著手?

央視紀錄片《甲骨王朝》視頻畫面
在早期,文字的變遷主要是基于字形逐漸演變的。相鄰朝代中,字形的變化通常有跡可循。沿著文字發展的脈絡進行字形對比,是甲骨學家重要的破譯方法。

央視紀錄片《甲骨王朝》視頻畫面
為幫助未考釋的甲骨文揭開神秘面紗,莫伯峰教授與華為云AI工程師一起打造了字形匹配模型,通過檢索與單個甲骨文字符字形相似的金文字符,來幫助實現甲骨文的破譯。
將大量甲骨文與金文錄入到計算機系統后,華為云AI工程師利用神經網絡等技術,訓練出幫助識別甲骨文的字形匹配模型,讓AI掌握從甲骨文到金文再到現代文的文字發展規律,并模擬專家的破譯思路。“機器識別與人的識別效果非常接近”,莫伯峰教授這樣說道。同時,模型推理出的關于甲骨文-金文的匹配結果,往往能給甲骨學家們一些關于字形演變的新思考。

首都師范大學甲骨文研究中心莫伯峰教授
然而,對甲骨文考釋而言,能夠從文字相似度的角度來破譯的未釋字數量相對有限,字形匹配模型的應用能解決的問題僅為冰山一角。剩余的“文化密碼”,也許需要一個全新的破解思路。
語義推理模型 幫助推理文字的AI界“福爾摩斯”
讓AI學習專家在古文字考釋中常見的“辭例歸納法”,是該項目中的另一項創新。所謂“辭例歸納”,意即根據上下文語境推理出某個字或某詞組的含義。比如當我們使用計算機和手機的聯想輸入法,只要輸入一些內容,就能自動預測接下來可能會搭配的文字,這種預測其實就是根據語境和辭例歸納出來的,也就是機器的“辭例歸納”。
為讓AI與人類一樣具備識文斷句、上下文理解及推理能力,在模型構建環節,華為云AI工程師以8億字的《四庫全書》作為語料,結合通假字、同音字等古文規則,培養人工智能的語感,同時也能讓人工智能系統化地學習漢朝至清乾隆時期的中國古典文化。
團隊以已經具有成熟釋文文本的戰國楚竹書《上博簡》(1-9)中的2103個字作為測試對象,隨機遮蔽某個文字,并讓模型預測遮蔽處的文字含義。語義推理模型可以在備選字符中為遮蔽處推選出五個可能的正確選項,有效地幫助專家縮窄探索范圍。

央視紀錄片《甲骨王朝》視頻畫面
為甲骨研究注入新活力 華為云在路上
正確理解一片甲骨刻辭的內涵,并不僅僅取決于其中的所有文字是否可識,更重要的是能否讀懂刻辭內容。接下來,華為云AI工程師一方面計劃引入華為云盤古大模型,基于其優秀的泛化能力,解決甲骨文研究領域知識和數據不足的瓶頸問題。另一方面計劃構建關于甲骨文的知識圖譜,承載既有的研究成果,用圖網絡的形式展示甲骨拓片所蘊藏的豐富信息,從更高維度的視角來推動甲骨文的研究。
華為云人工智能領域總裁賈永利表示,新興技術讓學界專家得以將人類經驗與計算機自然語言相結合。通過AI對甲骨文研究的賦能,早期文明史的探索步伐將邁上新的臺階,蘊藏在珍貴文物中的優秀傳統文化將能更好地實現創新性發展。

華為云人工智能領域總裁賈永利
未來,華為云將進一步攜手各領域專家學者,深入多學科交叉行業,積極探索更多人工智能的落地形式,為伙伴及開發者創造無限的可能。
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













