ニュース

音声を活用する多様な業務のDXを支援――、NECが音声認識技術を活用した新サービスを提供

第1弾はWeb会議音声のテキスト化サービス、APIサービスを用意

 日本電気株式会社(以下、NEC)は7日、独自の音声認識技術を活用したDX(デジタルトランスフォーメーション)支援サービス「NEC Enhanced Speech Analysis - 高性能音声解析 -」を開発したと発表した。その第1弾として、NECのクラウド基盤上でテキスト化した音声認識結果を返送する「APIサービス」、ならびに、Web会議の音声をリアルタイムでテキスト化し出力できる「Meeting Assistant」の2つを提供開始する。

 「NEC Enhanced Speech Analysis - 高性能音声解析 -」は、最新のディープラーニング(深層学習)を活用した独自の音声認識技術を用いて、さまざまな企業のDXを支援するもの。自由会話の認識精度や耐騒音性の高さに加えて、複数の人が参加している会話でも発言ごとに話者を識別可能といった特徴を備えており、NECが2月に実施した社内実証では、自由会話の認識精度が平均94%を記録し、従来製品と比較して10%以上高いことが確認されたという。

 また、「NEC Advanced Analytics -テキスト分析 with Deep Learning」などのテキスト分析技術を組み合わせることで、会話内容の要約やNGワードの自動検出、契約時における証跡作成にも対応可能。音声をより価値ある資源に昇華して、業務のDX化の加速を支援するとしている。

「NEC Enhanced Speech Analysis - 高性能音声解析 -」の特長

 今回発表された第1弾のうち「APIサービス」では、音声データをNECのクラウド基盤上でテキスト変換し、音声認識した結果を利用企業のシステムへ返送してくれる。騒音の多い屋外環境にも強いため、建設現場やプラント設備等における現場報告作業など、多様な業務の効率化を支援できるとのこと。価格は10時間あたり900円(税別)から。

 一方の「Meeting Assistant」は、Webアプリケーションを通じてWeb会議サービスでの発話内容をリアルタイムにテキスト化するもの。テキスト化の際には発話者名も自動付記できるほか、変換された発話内容をテキスト形式で出力可能なため、議事録作成にかかる時間を削減できるとした。さらに、会議開始時に議事録タイトルや出席者等の情報を登録すれば、過去の議事録の一覧管理も可能になるとしている。

 Web会議サービスは当初Zoomに対応し、その他のサービスには6月以降の対応を予定する。価格は10時間あたり3000円(税別)から。

「Meeting Assistant」画面イメージ