ニュース

NTTアイティ、音声認識クラウド「SpeechRec Cloud」~声使うアプリの開発が容易に

SpeechRec Cloudの概要

 NTTアイティ株式会社は、スマートデバイスで簡単・高精度な音声認識が利用できるクラウド型音声認識サービス「SpeechRec Cloud」を24日より提供する。音声認識を活用したアプリを簡単に開発できる。

 SpeechRec Cloudは、従来のオンプレミス型「SpeechRec」をスマートデバイスからより簡単に利用できるようにするため、新たにクラウドサービスとして提供するもの。

 音声認識エンジンとして、WFST音声認識技術を駆使してNTT研究所が新たに開発した高速・高精度の音声認識エンジン「VoiceRex」を搭載する。また、背景雑音の抑制や音声データのエンコードなど、音声認識を利用する上で必要となる機能を搭載したクライアントライブラリも用意している。これらにより、高性能な音声認識を利用するアプリ開発を、より簡単に行えるとしている。

 音声認識の利用形態に応じた2種類のサービス種別として「同時接続保証型」「ベストエフォート型」を提供。前者はリアルタイムの認識が必要で常時利用が見込める用途――例えばスマートデバイスのテキスト入力に音声認識を利用する場合や、スマートフォンのリモコンアプリを音声認識で利用する場合などに最適。後者はリアルタイム性はそれほど重要でなく、1ユーザー単位で低コストに利用したい用途――例えば、会話を録音したファイルを音声認識でテキスト化したい場合などに最適という。

 クライアントライブラリはまずAndroid版(Activity形式)を提供、iOS版やWindows版も順次提供する予定。雑音抑制や音声データのエンコードを利用して、スマートデバイスにメモしたいことやかかってきた電話を録音し、音声認識した結果をテキスト情報として残したり、ネットワーク対応型のサイネージ画面でコンテンツの選択などの制御を音声認識で行ったりするアプリ例を挙げている。

アプリ例

 価格は、同時接続保証型が初期費用15万円(税別)、月額費用が最大10万円(税別、利用規模・内容に応じて個別見積もり、1接続あたりの月額費)。ベストエフォート型が初期費用15万円(同)、月額費用が100ユーザまでで500円(税別)/ユーザー。クライアントライブラリは個別見積もり。開発サポート費(オプション)が120万円(税別)。NTTアイティでは年間で同時接続数100件、ベストエフォート型ユーザー数5000人の導入を目指す。

川島 弘之