ニュース
ElevenLabsとIBMが提携、IBMのAIエージェント「watsonx Orchestrate」にElevenLabsの音声認識・音声合成機能を統合
2026年4月17日 13:03
米ElevenLabs社と米IBMは現地時間3月25日、ElevenLabsの音声認識(Speech-to-Text)および音声合成(Text-to-Speech)機能を、IBMのAIエージェント製品である「watsonx Orchestrate」に統合する協業を発表した。今回の協業により、顧客は企業のセキュリティとスケーラビリティのニーズに対応しつつ、AIエージェント主導の体験を向上させる、より豊かで自然な音声対話を提供するためのツールを利用できるとしている。
音声は、顧客や従業員と対話するAIエージェントのワークフローにおいて重要な媒体となっているが、長い待ち時間、柔軟性に欠ける通話フロー、そして機械的に聞こえる音声が、ユーザー体験を損なうことがあったと説明。ElevenLabsの高品質な音声合成技術の統合により、70言語にわたり、人間の話し言葉が持つニュアンス、感情、リズムを取り入れた、明確で自然なコミュニケーションが可能な、セキュリティとコンプライアンスを重視した音声対応エージェントを構築できるようにする。
今回の統合により、AIエージェントの機能をテキストベースから音声ファーストの対話へと拡張し、組織はより効果的で人間中心のAI体験を提供するための高品質な音声オプションを利用できる。例えば、政府機関や公共サービスでは、医療、福祉、教育、市民活動に関する情報を支援するために、複数の言語への対応が求められるが、ElevenLabsの統合により、AI電話エージェントは、複数の地域アクセントや声色を使い分け、70言語で会話することが可能になる。さらに、銀行、保険会社、医療提供者、公益事業者なども、カスタマーサポート、営業、従業員体験、社内業務といった主要なケースにおいて、より多くのコミュニティーに対応できるようになる。
IBM watsonx Orchestrateは、顧客がビジネス全体のワークフローを自動化するためのAIエージェントを構築、展開、管理、統制できる統合プラットフォーム。既存のシステム、モデル、自動化ツールと接続し、エージェント間の連携を可能にし、信頼性と説明可能性を備えたエンタープライズAIのためのスケーラブルな基盤を提供する。
今回の統合により、IBM watsonx Orchestrateでエージェントを構築する顧客は、ElevenLabsの高品質な音声と1万以上に及ぶ豊富な音声ライブラリーにアクセスできる。また、PCI準拠による安全な決済処理、HIPAA準拠のデータ処理を支援するゼロリテンションモード、データレジデンシーなど、エンタープライズレベルの保護機能も利用できる。これらの組み合わせにより、エンタープライズ規模の展開に必要な一貫性、セキュリティ、信頼性への対応を強化し、グローバルなユーザーベースに対して高トラフィックかつ高同時接続の対話を支援する。
ElevenLabsとIBMは、企業がテキストのみのエージェントから、拡張性を備えたエンタープライズ向けに設計された、音声ファーストで人間中心のAI体験へと移行するのを支援するため、今後も協力を継続していく予定としている。
