ニュース

NTTテクノクロスの音声合成ソリューション「FutureVoice」、最新技術によりさらに自然な音声合成が可能に

デザイン思考を活用したUIの刷新も

石井一志

2021年8月5日 08:00

　NTTテクノクロス株式会社は4日、音声合成ソリューション「FutureVoice」をバージョンアップし、同日より提供開始すると発表した。最新のAI技術を用いて、さらに自然な音声を実現するほか、ユーザーインターフェイス（UI）の刷新も行っている。

　FutureVoiceは、さまざまな分野の「声」に活用できる音声合成ソリューション。NTT人間情報研究所が開発した、深層学習を用いた音声合成技術をもとに、少量の音声データから人の声と遜色（そんしょく）ない自然な合成音声を実現するという。

　今回の新版では、NTT人間情報研究所が開発した最先端AI技術「ニューラル波形生成型音声合成技術」を活用して、デジタル処理による機械的な音を極限まで削減し、さらに自然な音声を実現できるようにした。声優や有名人の音声合成においては、声の再現性が一層高まるため、活用の場面が広がるという。

　また、国内初という独自の高速音声波形生成アルゴリズムにより、一般的なCPUにおける実用的な処理性能と自然な音声合成を両立したとのこと。

　さらに、顧客の潜在的な課題を抽出するNTTテクノクロスのデザイン思考を活用し、UIを刷新。直感的な操作を誘導するカラーデザインや表示形式（パターン表示やタグ付など）を採用している。あわせて、動画のナレーション向けの音声制作において、長文の音声を作成する際にセリフ単位で管理できるようにしており、効率的な作業を可能にした。

　このほか、要望が多かったという、声の高さの部分的な上げ下げや長さの調整を行う機能が追加され、イメージ通りの音声制作を支援するとしている。

刷新された新UI