ニュース

NTT、HTML5ブラウザで利用できる高精度な音声認識技術を開発

 日本電信電話株式会社(NTT)は11日、HTML5対応ブラウザから利用できる高精度な音声認識技術を開発したと発表した。

 開発した技術では、W3Cで仕様策定が進められているJavaScript APIを組み合わせることで、端末種別やOSの違いによらず、HTML5対応ブラウザから音声認識を使ったサービス利用可能にした。これにより、利用者は事前にソフトウェアなどをインストールすることなく、音声認識を使ったWebアプリケーションの利用が可能になる。

仕組み

 また、さまざまな利用環境での使用に対応するため、雑音の混じった音声から実際に人がしゃべった音声区間のみを抽出する技術である音声区間検出機能も搭載。周囲環境によらず、高精度な音声認識が可能だという。

 エヌ・ティ・ティ アイティ株式会社(NTTアイティ)では、この技術をNTTより取得し、「HTML5ブラウザによる音声認識サービス“SpeechRec for Browser”」として、2014年10月から国内で販売を開始する予定。

 音声データの処理をクラウド側に集約しているため、ほかのサービスとの連携が容易で、検索キーワード入力や、通販サイトでの商品名や個数などの項目入力、WebRTCアプリとの連携、対話型サイネージなど、各種のサービスに適用できるとしている。

利用イメージ

三柳 英樹