ニュース

音声認識APIサービス「AmiVoice Cloud Platform」、長時間・複数の音声データを一気に文字化できる新APIを提供

 株式会社アドバンスト・メディアは8日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform」を強化し、「非同期HTTP音声認識API」を新たに提供すると発表した。

 AmiVoice Cloud Platformは、クライアントアプリケーションに特別なライブラリを組み込むことなく音声認識機能を実装できる、音声認識APIの開発プラットフォーム。音声文字化や音声対話、音声制御、音声翻訳など、アプリケーションやWebサイトなどの各種サービスに使用できる。

 従来は、リアルタイム音声認識用の「WebSocket音声認識API」とバッチ音声認識用の「HTTP音声認識API」を提供していたが、今回は新たに「非同期HTTP音声認識API」をリリースした。

 複数ファイルの非同期処理をまとめて行うため、音声ファイルのサイズや長さに関わらず迅速に認識結果を得られる点が特徴。これまでの「HTTP音声認識API」では対応できなかった16MB以上のファイルも一括で音声認識できるので、コンタクトセンターの通話音声、会議音声、動画・ラジオ・YouTubeの音声など、長時間の音声データをまとめて文字化する場合に適しているとのことだ。