ニュース

「AI記者」へ一歩前進、NTTデータが気象ニュース原稿の自動生成実験

実験の概要

 「AI記者」の実現可能性を検討すべく、株式会社NTTデータが実施した実証実験に関する結果が27日に発表された。気象庁が発表する気象電文をもとに、読み上げ用の気象ニュース原稿を自動生成するという内容。結果として、多少の修正が必要な部分はあるものの、おおむね正確な原稿が作成できることが確認された。

 実験は、2016年9月から4カ月間に渡って実施された。気象庁が公開した気象電文、アナウンサーが読んだ気象ニュース原稿それぞれ過去4年分をセットにし、原稿作成の規則性をディープラーニングでAIに学習させた。NTTグループのAI「Corevo」による日本語解析技術も活用した。

 ニュース記事の自動生成技術をめぐっては、米国のメディア業界で2014年頃から商用利用が広がっているという。しかし、この技術は、あらかじめ用意されたテンプレートに単語や数値を埋め込むという仕組みのため、そもそものルール設計に手間がかかっていた。

 対してNTTデータの実験は、ルール設計自体をディープラーニングで行う方式。また、生成パターンが比較的シンプルという理由から、対象を気象ニュースに限定している。

 NTTデータの社内評価によれば、自動生成された気象ニュース原稿の「日本語文法の正しさ」は4点満点中3.86点、「意味の正しさ」は4点満点中3.07点だった。結果として、自動生成されたニュース原稿をわずかに修正するだけで、元の気象電文と矛盾しないレベルの原稿ができあがったという。

 今回の実験では気象ニュースを対象としているが、元となるデータをの種類を変更すれば、企業の決算発表、スポーツ記事なども「AI記者」がカバーできる可能性がある。

 NTTデータでは、気象ニュース自動生成の商用化、他分野展開を目指し、今後も実験を進める。