富士通研、校正履歴をもとに自動学習する文章校正技術を開発


 株式会社富士通研究所は4月4日、人が校正した文章の修正履歴を使って、文章校正を自動的に行う技術を開発したと発表した。

 今回開発した技術により、オフショア開発の拡大にともない増加する、外国人による仕様書などの日本語文章の品質向上が可能になる。富士通研では、中国語ネイティブが作成した日本語文章に対して、1万件の校正履歴を用いた自動校正を実行したところ、約80%の誤りが修正できることを確認したという。

 富士通研では中国語から日本語への翻訳を主な用途に想定しているが、日本企業が中国企業に開発発注する際の発注書類があいまいで、中国企業から確認のため差し戻されることも多く、修正履歴を蓄積することで、そうした文書の自動校正も可能になるという。

 開発の背景について富士通研究所では、オフショア開発においては、納品を行う前に日本人による校正作業を行う必要があり、この校正作業に多大な時間が費やされており、校正を担当する日本人の仕事を代替してくれるような、なおかつ、外国人執筆者自身が効率的に校正できる日本語校正支援システムが求められていたと説明している。

 今回のシステムでは、人が行った校正作業の履歴データ(校正前と校正後の文章のペア)を登録することにより、人による校正をシステムが学習。具体的には、次のような手続きで校正を行う。

 (1)対象文と似た文を修正前の文に持つ校正履歴データを検索、(2)対象文と修正前の文の共通部分と修正後の相違部分を特定、(3)対応する語句が持っている品詞など文の構造としての共通性から文の距離を求め校正の可否を判断、(4)校正可能であれば、対象文の表現を修正する。

 このシステムでは、履歴が蓄積されるほどシステムの校正能力が高まり、また、人間が校正した文をそのまま利用することが可能になったため、これまで自動修正が困難だった誤りも検出し、正しい表現に治すことができるようになったという。

 富士通研では、2012年度より、富士通研のオフショア開発を担っている中国の関係会社にて、この技術を利用して開発した校正支援ツールの適用を開始。2013年度を目途にクラウドサービスとしての実用化を目指す。


関連情報