研究人員使用人工智慧破解「死海古卷」

原標題:研究人員使用人工智慧破解「死海古卷」 來源:參考消息網

參考消息網6月9日報道 「科學2.0」網站近日發表題為《人工智慧筆跡分析提供了有關死海古卷手稿作者的線索》的報道,全文摘編如下:

1946年,隨著二戰結束,考古學家重返工作崗位,用了10年時間在死海附近約旦河西岸艾因費什哈的12個洞穴里,發現了被丟棄的希伯來語《聖經》手稿。這些「死海古卷」的殘片中包含原本不會隨著時間推移而保留下來的《次經》,除了缺少《以斯帖記》。

抄錄基督教《聖經》的是匿名僧侶,而死海古卷也沒有任何署名,但人們一直在猜測是誰抄錄了它們。有人希望至少能通過筆跡找到抄寫員之間的一些聯繫。

在對古姆蘭1號洞出土的「大以賽亞書卷」的一次最新分析中,研究人員利用計算機來辨識筆跡,包括握筆方式等生物力學特徵對筆跡的影響。

這幅古卷中的筆跡看上去幾乎一模一樣,但有人認為它是由兩位書寫風格非常相似的抄寫員抄錄的。研究人員發現,字母「a」在這幅古卷中出現了5000多次,它們非常相似,單憑肉眼幾乎無法比對。

但計算機不知道累也不會分心,因此更適合分析大型數據集,比如5000個手寫的字母「a」。數字成像技術使得在字元微觀層面進行各種計算機運算成為可能,例如比對筆畫(被稱為結構)以及整個字元(被稱為字體)。

研究人員遇到的第一個障礙是要訓練出一種演算法,將文本(墨跡)與背景(皮革或紙莎草)分離開來。為了實現這種分離(即「二值化」),研究團隊開發出一種先進的人工神經網路,能夠利用深度學習對它加以訓練。這個神經網路將2000多年前抄寫員留下的原始墨跡,完好無損地保存到數字圖像上。

荷蘭格羅寧根大學博士研究生馬魯夫·達利完成了這項研究中的首次分析測試。他對結構和字體特徵的分析顯示,「大以賽亞書卷」中的54欄文本可以分成不同的兩組,它們不是隨機散布而是集中分佈在古卷中的,而變化出現在大概一半的位置。

達利由此推測抄寫員可能不止一位,於是將這些數據交給了蘭伯特·朔馬克教授,後者利用字母碎片模式重新計算了各欄之間的相似性。這次的第二步分析證實了存在兩位不同的抄寫員。第二位抄寫員在書寫中較第一位抄寫員表現出更多變化,不過他們的筆跡非常相似。

在第三步中,研究團隊生成視覺分析。他們創建了包含書卷中一個字母所有變體的「熱圖」。然後,他們生成了這個字母在前27欄和后27欄文本中的平均版本。用肉眼比較這個字母的兩種平均版本,就會發現有所不同。這就將計算機分析和統計分析與人類對數據的粗略理解聯繫在了一起,因為熱圖既不依賴也非產生於第一次或第二次分析。

這幅古卷的某些方面和文本出現筆跡變化的位置導致一些學者提出,從第27欄開始更換了一位新的抄寫員,但這個觀點並沒有得到普遍接受。研究報告的作者則認為,他們的量化分析和統計分析證實了這個觀點。

除了改變死海古卷——可能還有其他古代手稿文獻——的古文字學之外,這項對「大以賽亞書卷」的研究還為基於物理特性分析古姆蘭古卷文本開闢了一條全新的道路。現在,研究人員能夠觸及抄寫員個人的微觀層面,仔細探究他們是如何完成這些手稿的。

台灣疫情資訊

縣市累計確診人數

相關熱門

綠色永續