ニュース

NTTレゾナント、声や表情を認識して自然な受け答えができるマルチモーダルAIなどのAPI群「AI suite」を提供

 NTTレゾナント株式会社は8日、AI技術のAPI群「AI suite」の提供を開始した。価格は要問い合わせ。

 AI suiteは、テキスト情報や音声・映像情報など、複数の入力情報を活用して受け答えをするマルチモーダルAIによるAPIを提供する。マルチモーダルAIは、NTTレゾナントが積み重ねた自然言語処理技術と、NTTコンピュータ&データサイエンス研究所(以下、NTT研究所)の音声・映像認識技術の統合により、NTTレゾナントが新たに開発した技術を利用している。

 この新技術により、テキストに加え、声の調子や表情、みぶりから、ユーザーの属性・感情・行動を統合的にAIが予測し、ユーザー一人ひとりに寄り添って、最適かつ自然な受け答えができるAIを実現する。

「AI suite」の概要

 ユーザーの発話に対して、ルールベースでパターン化した受け答えではなく、人間らしいAIによる応答が可能。AI suiteのAPI群は、高度な言語解析技術に強みを持っており、複数回の受け答えで会話の文脈を理解し、ユーザーの意図を踏まえ的を射た応答を実現でき、会話の中で日時・場所・価格などの重要な要素を抽出することもできるので、AIによる自動受付システムなどとの連携も行える。

 Webブラウザーをはじめ、LINEやTwitterなどのSNS、スマートフォン向けアプリへの組み込み、ARやVRとの組み合わせなど、さまざまなプラットフォームで展開・連携が可能。必要なAPIを切り出して提供することにも対応する。

 また、AI suiteの基盤システムは、サーバー負荷に応じて自動でクラウドサーバーの増減を調節するオートスケールに対応しており、急なアクセス増などによるサーバー負荷の上昇時でも、安定してサービスを提供できるとしている。

 NTTレゾナンスでは、AI suiteの活用により、オンライン/メタバース上で接客するAIや、顧客との音声会話で検索・予約・購入を実行するAIなどが実現でき、AIによるユーザーとの高度なコミュニケーションを実現したい、幅広い業界・業種のニーズに応えるとしている。