當古代石碑上的字不完整,我們通常只能靠歷史學家一字一字地推敲、比對,耗時又困難。Google DeepMind 推出的 Aeneas 系統,試著用 AI 協助處理這些碎裂的拉丁銘文。它可以幫助學者修補破損文字、估算撰寫時間,甚至判斷地理來源。
研究中提到,Aeneas 的模型結合了文字資料和圖片,屬於一種「多模態生成神經網路」(Multimodal Generative Neural Network)架構。這表示它不只是看文字,還能從石碑圖像中學習格式和風格,用來判斷這段文字可能來自哪個地區、哪個年代。這樣的應用對於處理過去難以解讀的史料,提供了一種新的可能性。
(Source:Aeneas,下同)
歷史學者在處理銘文時,最常遇到的問題就是「缺字」,而且有時候連缺了幾個字都無法確定。這種情況被稱為「不確定長度的文本復原」(arbitrary-length restoration),過去幾乎只能靠經驗猜測。
Aeneas 模型的一個重要設計是,它能夠同時預測「缺了幾個字」和「可能的內容」,並透過上下文來做推測。這背後是語言模型中的「序列預測」(sequence prediction)概念,也就是根據前後語境來預測中間可能出現的字。研究結果指出,Aeneas 在這類復原任務中,即使在不知道缺字長度的情況下,準確率仍超過五成,顯示這項技術有實際應用的潛力。
除了補字,Aeneas 還能從資料庫中找出「平行文本」(parallel texts),也就是與目前碑文內容或格式相似的其他銘文。在歷史研究裡,這叫做「上下文比對」或「平行分析」,是用來建立歷史脈絡的一種方法。
Aeneas 的做法是將每段文字轉換成「向量表示」(embedding),再計算它和其他碑文的距離,從中找出最接近的幾筆資料。這不只是找類似句子,而是綜合了用語、風格、時間與地點的綜合比對。這樣的設計可以幫助學者省下大量比對資料的時間,也有助於發現過去未注意到的關聯。
這套系統實際測試過後的成果值得注意。研究團隊找來 23 位歷史學者,讓他們在沒有使用 AI 的情況下先做一次任務,再加入 Aeneas 的協助後重新進行比較。
結果發現,當學者可以參考 AI 提供的平行碑文和推測建議時,他們在「地點判斷」、「時間預測」以及「文字修復」這三個任務中的表現都顯著提升。這顯示人與AI的「協同合作」可以讓研究成果更可靠,也更有效率。比起單靠 AI 或單靠人力,兩者搭配能發揮更大的價值,這也為未來的學術合作模式提供了新的方向。
AI 的應用讓許多原本曠日費時的研究流程變得更快速,但它並不是要取代人類學者。Aeneas 模型的任務是「提供建議」,而非「給出結論」。歷史學的基本工作仍需要人來判斷、解釋,尤其是文化背景與語意變化。
研究中也指出,AI 模型的判斷主要根據已有資料,因此仍會受到資料偏誤的影響。這提醒我們,AI 是一種輔助工具,而不是最終答案。只要善用這些工具,學者可以把時間花在更關鍵的思考與詮釋上,讓歷史研究走得更遠,也更深入。
從補字、比對到定位時間與地點,Aeneas 展現了AI在歷史研究中的多種可能。它不是神奇魔法,也不是要取代人,而是一套能大幅提升研究效率與品質的輔助系統。透過語言模型與資料庫的整合,它能幫助學者從碎片中找出線索,從看似零散的文字中重建歷史的脈絡。這樣的技術應用,也提醒我們,人文研究並非排斥科技,而是可以善用科技工具,做出更扎實、更廣闊的分析。
未來,當資料越來越多、工具越來越成熟,AI 可能會是歷史研究最有力的搭檔之一。不過,科技再強,也仍需人來判斷、來解釋,才能真正理解歷史的意義。AI 負責「找出可能性」,人類負責「做出選擇」──這樣的分工,或許才是未來人文與科技真正的合作方式。
(首圖來源:AI 生成)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:万宁市)
非常“野狗”范儿的点评,现场三水老师又会怎么分享W的那些刷屏案例呢?来现场活捉。...[详细]
微信的谣言模型库是现在国内最全的一家,这当然也和微信移动端一哥的地位有关。...[详细]
最终在米哈游准备IPO,进行股权调整的过程中,作价人民币900万元将900万股股份转让给萍乡盈尚,成功实现了退出。...[详细]
第一届超会议吸引了9万多人来到现场,347万人观看直播,2016年举办的超会议吸引了15万人到达现场。...[详细]
TOP3:Keep首支品牌宣传片《自律给我自由》 胡辛束(胡辛束公众号创始人、知名作家、自媒体人):“自律给我自由”这句slogan成为了当下年轻人非常认可的一种价值观。...[详细]
综合而言,创业投资的产生源于传统信贷市场和证券市场对于初创企业融资的“理性歧视”,是一种可行的替代机制。...[详细]
但是,这样一款重度手游,它和《开心消消乐》之类的轻量游戏相比,可玩性和可发展空间明显更高,而且对比于其他排名在前列的重度手游例如《梦幻西游手游》而言,它却异常地不会主动去占用你每天的日常时间,其他的大...[详细]
阿里、苏宁等电商平台都纷纷在农村、乡镇布局,试图分一杯羹。...[详细]
用户只需要在这个这个片区内的ETCP停车场还车即可。...[详细]
人工智能还有很多难题,创业者也很难跟巨头去拼人才、用户、流量与资本 所以说,以深度学习为主力的这一波人工智能浪潮吹了很多年,巨头也投入了很多资源,但从当前巨头的人工智能助理看出,深度学习在处理复...[详细]