ニュース

NXワンビシアーカイブズ、LLMを用いて古文書の現代語訳の品質評価方法を共同研究

現代語訳に最適なモデルの選定、誤訳・ハルシネーションの傾向分析も実施

 株式会社NXワンビシアーカイブズは23日、大規模言語モデル(LLM)を活用した古文書の現代語訳に関する品質評価方法の研究を実施し、LLMによる誤訳やハルシネーションの傾向を分析したと発表した。これは、大学共同利用機関法人 人間文化研究機構 国立歴史民俗博物館の橋本雄太准教授と共同で行ったもので、その研究成果について、5月17日開催の一般社団法人情報処理学会 第138回人文科学とコンピュータ研究発表会にて報告したという。

 日本の古文書は、現代では使用されない字体「くずし字」が利用されているほか、日常では用いない言葉・文体で記述されているため、現代社会において活用するには、現代で使用する字体への文字起こしや現代語訳が必要不可欠となっている。

 今回、NXワンビシアーカイブズでは、国立歴史民俗博物館 橋本准教授からの委託を受け、中世および近世の古文書をサンプルとして、LLMを活用した現代語訳に最適なモデルの選定や、その現代語訳の品質評価、さらに誤訳やハルシネーションの傾向分析を実施したとのこと。また今後も、橋本准教授とプロンプトエンジニアリングを活用した翻訳精度の向上や、現代語訳の品質評価の自動化に向けた検証に継続して取り組むとしている。

 なおNXワンビシアーカイブズでは、LLM等を活用し、歴史資料をより広く、より便利に利用できる仕組みづくりに取り組んでおり、橋本准教授との連携による古文書の現代語訳の研究も、こうした取り組みの一環として実施された。

 同社には、国立公文書館および日本アーカイブズ学会が認めたアーキビスト、博物館勤務経験を有する学芸員が在籍しており、そうした人員の経験・知見を生かして、歴史資料保存機関のニーズを把握しながら、古文書に限らず、その他の歴史情報についてもLLMの利活用効果を検証していく方針である。