Infostand海外ITトピックス
「Google Duplex」の衝撃 機械と分からない話し方のAI
2018年5月14日 11:33
人間と区別がつかないような自然な話しぶりのAIが、ヘアサロンやレストランの予約をするデモをGoogleが披露した。予約受付に電話して空き状況を聞きながら、日程を決めてゆく様は、どこにも機械と思わせる部分がない。ロボットが、また一歩人に近づいたことへの称賛とともに、倫理面、社会的な影響などの懸念を挙げる声も出ている。
AIが会話で相づちを打つ
Googleが5月8日から3日間、本拠地のマウンテンビューで開催した年次開発者イベント「Google I/O 2018」では多くの発表があり、開発者やメディアを沸かせた。その中でも話題をさらったのが、AI音声技術「Google Duplex」だ。ユーザーはGoogle Assistantに指示して、会話を使ったタスクをさせることができる。
CEOのSundar Pichai氏は基調講演で、Google Assistantがヘアサロンに電話をして予約をするデモを披露した。ヘアサロン側が「ちょっとお待ちください」と言うと、Google Assistantは「ええ(Hm-mmm)」と相づちをうつ。「指定した時間に空きがない」と伝えられると、「10時から12時の間は?」と聞き返す。
結局、10時に予約を入れて電話を終えた。もう一つのレストラン予約のデモでは、「5人以上でないと予約できません」と言われて、「席に案内してもらえるまで、通常どのぐらい待つのか?」と、聞き返している。
いずれも話すスピードやピッチが自然であるだけでなく、相づちを入れるなど、機械とは思えない話しぷりだ。また、駄目だと言われると、別の時間を尋ねるといった対応もできる。
Googleの公式ブログによると、「RNN」(再帰型ニューラルネットワーク)を基盤に、同社のTensorFlowベースの汎用機械学習プラットフォーム「TensorFlow Extended(TFX)」を使ってハイパーパラメーター最適化を行い、モデルを改善した。
自然な会話のための技術としては、「AlphaGo」で知られるDeepMindチームが開発した「WaveNet」や、Google開発の音声合成技術「Tacotron」と波形接続型の音声読み上げ(TTS)エンジンを用い、状況に応じたイントネーションの制御をしているという。
Google Duplexは実験中の技術だが、提供中のGoogle Assistでは機能強化も発表された。コマンドごとに「Hey Google」と言わなくても会話が続く「Continued Conversation」(継続的会話)や、6種類の音声の選択肢などで、共通しているのは「より自然に、人間のように」ということだ。
「Google Assistantが掲げる“パーフェクトなアシスタント”のビジョンは、自然な会話ができることだ」(Pichai氏)という。これによって、現実の世界で、必要な時に、機械に任せられるようになるという。