ニュース

NTT Com、210万語超の日本語辞書を用いた自然言語解析API「COTOHA API」の本格提供を開始

 NTTコミュニケーションズ株式会社(以下、NTT Com)は5日、210万語超の日本語辞書を用いた自然言語解析APIサービス「Communication Engine “COTOHA API”(以下、COTOHA API)の提供を開始した。

 NTT Comでは、2016年10月から日本語による対話が可能なAIエンジン「Communication Engine “COTOHA Virtual Assistant”」を提供している。同サービスは、NTTグループが40年以上にわたって蓄積・精錬した日本語辞書とAI関連技術「corevo(コレボ)」と、NTT Comが独自開発した自然言語解析技術により、的確な日本語の理解による自然な対話を実現している。

 今回、同サービスに実装されている高度な自然言語解析技術を、さまざまなサービスに手軽に組み込み、開発の迅速化や新サービスの創出に活用できるAPIサービスとして、COTOHA APIの提供を開始した。

 COTOHA APIは、日本語のさまざまな意味を理解できる基本語辞書と、企業名や業界用語に対応する専門用語辞書を合わせた、世界最大級となる210万語超の日本語辞書を活用してAPIを提供する。

 専門用語辞書は、COTOHA APIの提供にあたって新たに追加するもので、企業や団体の固有名詞、経済や法令に関する用語、製造業や情報通信業などさまざまな業界の用語に対応する。また、収録語彙については定期的なメンテナンスを行うことで、有用性の維持向上を行う。

 日本語理解については、NTTグループ独自の日本語構文解析技術と、単語を3000種の意味属性に分類できる日本語語彙大系を基礎技術として活用し、単語の意味を正確に捉え、文脈に応じて変化する言葉の意味も理解することが可能。これらの高精度な日本語理解に基づいた機能を利用できる。

 共通して利用できる辞書に加え、顧客専用の個別辞書を設け、顧客自身で編集することが可能。また、解析の目的に応じて、参照する辞書の選択や出力するキーワード数など、APIのパラメーターをカスタマイズでき、これによりさらに精度の高い自然言語解析を行える。

「COTOHA API」の機能

 サービスでは、日本語テキストの構造と意味を解析する「構文解析」、人名や地名などの固有表現を抽出する「固有表現抽出」、「あれ」「これ」などの指示語・省略語を検知し、指し示す対象を特定する「照応解析(β版)」、文章からキーワードを抽出する「キーワード抽出」、2つの文章の類似性を数値化して出力する「類似度算出」、挨拶や同意、約束などの発話行為のタイプ判定および叙述文、命令文、質問文などの文タイプを出力する「文タイプ判定」、文章からユーザーの年代、職業などの属性を推定する「ユーザー属性推定(β版)」の7つのAPIを提供する。

 また、今後も、音声認識結果データの精度向上をサポートする「言いよどみ除去」「誤り箇所検知」「誤り箇所訂正」など、順次新しいAPIをリリースしていく。

 サービスメニューは、検証用として無償で利用できる「for Developers」と、商用の「for Enterprise」の2種類を提供する。「for Enterprise」の料金は月額13万円(税別)からで、APIコール数に応じた従量課金となる。