ニュース

くずし字資料をスマホで撮影してその場で解読――、凸版印刷がくずし字解読アプリ「古文書カメラ」を提供

2種類のくずし字解読AI-OCRと2つのモードで古文書の解読を支援

 凸版印刷株式会社は1日、古文書解読とくずし字資料の利活用サービス「ふみのは」において、スマートフォンで撮影したくずし字資料をAI-OCR技術によって解読する、iOS版くずし字解読アプリ「古文書カメラ」を発表した。Apple App storeにて、6月1日より配信を開始する。

 「古文書カメラ」は、凸版印刷が独自に開発したくずし字解読アプリ。2022年9月の開発発表以降、京都市歴史資料館、公益財団法人三井文庫、和洋女子大学の協力のもとで実証実験を行い、より使いやすいアプリUIの改善や、AI-OCRの読み取り精度の向上などの改良を行ってきたという。

 くずし字で書かれた資料は、版本や錦絵など、木版を用いて印刷されたものと、書簡や証文、日記などの古文書のように手書きのものがあり、それぞれ文字の形や使われている字種が異なる。同アプリではこれに対応できるよう、手書き、版本のくずし字それぞれに対応した2種類のAI-OCRを搭載しており、幅広い資料の解読を支援できるとのこと。なお、「古文書カメラ」に搭載されているAI-OCRは、解読率90%の精度を持つとしている。

 AI解読のモードは、AIお任せの「フルオートモード」と、同モードより高精度で、利用者が文脈に合った文字を選択しながら解読する「範囲選択モード」の2種類を搭載する。このうちフルオートモードは、画像の中にある文字領域を自動で検出し、つなげて書かれた文字の区切り位置も含めて、AIがくずし字を解読するもの。さらに詳細に解読したい場合は、範囲選択モードを利用することで、選択した数文字に対し、AIが候補文字を複数提示してくれるとした。

 こうした解読モード、およびAI-OCRの切り替えは、わかりやすいUIで、スマートフォンの操作に不慣れな利用者でも手軽な解読を行えるという。

 さらに、AIの解読結果が間違っていた場合は、利用者自身が解読した文字を直接入力できる仕組みを搭載する。修正した内容はAIの再学習へ反映され、段階的にAIの精度が向上するとのことだ。また解読結果は、画像・テキストでの保存に対応している。

 「古文書カメラ」のインストールは無料だが、AI-OCRによる解読機能の利用は10回/日に制限される。なお2023年夏には、App内課金による解読機能の回数制限解除を予定しているほか、Android版のアプリも、2023年秋の配信を予定している。