ニュース

TIS、自然言語処理で企業分析を行うためのデータセット「CoARiJ」を無償公開

 TIS株式会社は14日、自然言語処理で企業分析を行うためのデータセット「CoARiJ(Corpus of Annual Reports in Japan:コアリジェ)」を無償公開すると発表した。

 CoARiJは、有価証券報告書やCSR報告書、統合報告書の記載内容(事業概要や財務情報など)と、数値情報(株価およびTOPIXなどの指数)をまとめたデータセット。2014年度から2018年度までの5カ年度分を収録している。

 無償かつ日本語の企業文書データセットとしては初の公開となり、より高度な企業評価を行いたい研究者また企業は、CoARiJと自然言語処理技術を組み合わせることで、財務・非財務両面で分析を行うことが可能になるとしている。

 TISでは、アニュアルレポートなどの事業報告文書へ自然言語処理を活用することで、従来の財務分析にとどまらない、非財務分析を加えた総合的な企業分析を行いたいと考えており、自然言語処理による非財務分析はまだ発展途上であることから、研究の推進に貢献するため、CoARiJを無償公開すると説明。一般の企業にとってもわかりやすい形でのデータ提供は、TISのソリューションとして提供する予定としている。

 また、TISでは与信管理ソリューション「SCORE LINK」や企業分析サービス「Finplus」を提供しており、これらのサービスでは財務情報を主軸に扱っている。今後は、ここにCoARiJを活用した非財務情報の分析が加わることで、企業の与信・融資業務支援の充実が図れるとともに、投資・融資を受ける企業側にも数値面だけでない評価が受けられるというメリットが生まれると説明。財務・非財務両面の分析を支援していくことで、ESG投資をはじめとした持続可能な成長への投資を促進し、企業のSDGsの実現に貢献してくとしている。