ニュース

すべての人がより多くのことを達成できるように――、Microsoftが取り組むAIの民主化

日本マイクロソフトの榊原CTOが説明

 日本マイクロソフト株式会社は15日、人工知能(AI)に関する最新の取り組みについて説明した。

 日本マイクロソフト 執行役員 最高技術責任者(CTO)の榊原彰氏は、「Microsoftは、誰にでも使える『AIの民主化』を進めており、社会の重要課題解決のために、作り出すすべてのものにAI機能を導入していく。そして、どの産業分野に対しても提供していくことになる」と話す。

 また「社内では、AEther(AI and Ethics for Engineering and Resech:エイサー)を設置し、AIの開発に向けた倫理規定を定めている。ここでは、AIは人間の仕事を取るのではなく、人間の能力を補完、支援、補助するシステムであると定義している。プログラミングの段階、開発の段階、リリースの段階といった重要なステップにおいて、アドバイザリーパネルがその内容をチェックする仕組みがあり、法務部門なども参加して、きちっとルールが守られて、AIが開発されていることを確認している」とした。

日本マイクロソフト 執行役員 最高技術責任者(CTO)の榊原彰氏

 さらに、Amazon.com、Facebook、Google、IBMといったAIのリーダー企業とタッグを組んで「Partnership on AI」を設立し、倫理的問題、技術普及などに取り組んでいることも紹介した。

 Partnership on AIの設立やAI分野における協業について、榊原CTOは、「2030年ごろには汎用的なAIが登場するだろうが、それまでは、特化型のAIが中心になる。例えば、気象情報に特化したAI、渋滞情報に特化したAI、イベント情報に特化したAIなどが連携し、最適な形でナビゲーションするといったことも可能だ。AI同士が話し合い、それを可読性があるなど、効率性の高い形で理解を提供できるサービスが必要。そこに標準となるプラットフォームがある。これからプラットフォームが充実すれば、そのプラットフォームの上に乗るアプリケーションが増え、利便性が高まることになる。まだまだプラットフォームを充実させなくてはならない段階にある」などした。

Partnership on AI

チャットボットへの活用が増える

 AIは多くの関心を集めているが、榊原CTOは、「AIでなにかやりたいという声が出ているが、あまり具体化した要望がないのも実態。それは、かつてインターネットでなにかやりたいという声が出ていたのと同じである」と前置きし、「そうしたなかでも、最も多い話題が、チャットボットのサービスへの活用」だという。

 日本マイクロソフトでは、大きく「Cortana」と「りんな」という2つのサービスを提供している。

 Cortanaは全世界で約5億台のデバイスに搭載されており、130億以上の質問に回答した実績を持つ。1000以上のアプリに統合した形で利用されており、毎月1億4500万のアクティブユーザーがいるという。

 先ごろ、Amazon Alexaとの連携により、Windowsデスクトップ上で動作するCortanaをAlexaが呼び出して商品を注文できる、という活用を提案。「Amazonにとっては、5億台の端末にアプローチできるというメリットがある。また、AlexaはB2C向けのサービスであり、CortanaはB2Bにフォーカスしたサービス。お互いにいい補完関係になった事例」だとした。

 一方で、Amazon AlexaやGoogle Homeなど、音声スピーカーの領域へのMicrosoftの参入の可能性にも言及した。

 榊原CTOは、「Microsoftは、音声スピーカーといったハードウェアは作らずに、協業によって、この分野にCortanaを提供することになる。すでに、Harman KardonとHewlett-Packardの音声スピーカーに技術を提供している」と語る。

Harman Kardonのスピーカー

 またJohnson ControlsではサーモスタッドにCortanaを採用しているほか、BMWは自動運転にかかわる音声対話でCortanaを活用中。日産自動車の車は、Cortanaだけでなく、Office 365やSkypeにも対応しているそうで、「ダッシュボードにPowerPointのスライドが表示されることになる」という。

Cortanaを採用しているJohnson Controlsのサーモスタッド
日産のコネクティッドカー

応用が進む女子高生AI「りんな」

 女子高生AIである「りんな」は、現在、LINEとTwitterを含めて、約570万人の登録者に達し、女子高生らしい会話で対応してくれるともに、しりとりや似顔絵、ファッションチェックなどもしてくれる。この技術を活用したサービスとして、ローソンが「ローソンクルーあきこ」としてチャットボットサービスを提供。さらに、男子の俺様キャラクターである「りんお」のサービスを開始し、女性ユーザーを獲得しているという。

りんな

 また今回の説明では、新たな機能として、「りんなライブ」のサービスを開始したことを発表した。「これまでのチャットボットは1対1で対話をするものであったが、1対多人数での対話が行えるサービスとして提供する。実際の音声でも、返事をしてくたり、歌を歌ってくれたりする機能を追加している。パーソナルからソーシャルの会話になり、多人数でのコミュニケーションが可能となる」とした。

 「まだ広く告知をしていないが、サービス開始時間が訪れると、多くの人が待っていて、会話をはじめる。日本マイクロソフトとして、世界に誇れる技術のひとつである」。

 なお、りんなライブの音声合成の品質はあまり高くはないが、非難めいたことを言うとりんなが落ち込むなど、感情パラメータが導入されている。また、100人以上が同時接続できるとのこと。

 「日本固有のサービスだが、なぜか、メキシコからの参加も多い」という。

りんなライブ

マイクロソフトのCognitive Services

 Microsoftでは、Cognitive Servicesとして、現在、画像認識、音声認識、感情認識、言語理解、キーワードの抽出、翻訳など29種類のAPIを提供している。例えば、学習済みの画像認識技術を使いながら、さらにカスタマイズができるという点が特徴だという。

 「犬であるか、猫であるか、犬の場合には、どんな犬種かということまでは事前に認識しているが、それが自分が飼っている犬であるということや、犬の名前といった要素をカスタマイズできる。これはノンプログラミングで可能であり、他社が手がけていないところである」という。

29種類のAPIを提供

 Cognitive Servicesでは、いくつもの事例が出ている。

 例えば、北米ではマクドナルドのドライブスルーにおいて、音声認識を活用したPoC(概念実証)を開始しており、顧客がマイクに向かってオーダーした内容をテキストに変換して画面に表示。それをもとに注文を受け、支払いまで計算することで、複雑なオーダーの間違えや聞き間違えをなくし、スタッフの省力化を実現しているという。これは、マクドナルドのメニューなどに特化した学習を繰り返したことで、認識精度を高めたとのこと。

注文内容をテキスト化

 さらに翻訳サービスでは、テキスト翻訳において60カ国語に対応。Microsoft EdgeやOutlookに組み込む形で、翻訳が利用できるようになっている。また、Microsoft Translatorのライブ機能は、スマホに話しかけるだけで自動的に翻訳してくれるサービスで、現在10言語に対応している。

 「翻訳機能は、ニューラルネットによって精度が高まり、スムーズに認識するようになった」という。

 なお、Microsoftの音声認識技術の誤認識率は5.1%であり、人間の5.9%の誤認識率を下回っているという。「すでに人間の領域に入ってきている」とする。

 また、Microsoftの画像認識技術は、Image Netが実施した2015年の調査で世界一になったという。ここでは、前年に首位となった企業の約半分の誤認識率に進化し、3.5%の誤認識率を達成。5.1%という人間の誤認識率を下回った。

 さらに、Microsoftは、Seaing AIというiPhoneアプリを海外サイトで提供しており、「撮影した景色を画像認識し、その内容などを、音声で伝えてくれる。自分の知っている人の画像を登録しておけば、それも音声で教えてくれる」とした。

機械学習の領域ではたくさんの成果が出ている

 一方、現時点で最もAI開発の成果を生みやすいのは、数多くのデータを活用する機械学習の領域であるとする。

 「Microsoftでは、Azure Machine Leaning Studioを利用することで、誰もが機械学習のパワーを活用できる。データサイエンティストが活用している70種類以上の標準的な関数が用意されており、また、クラウド上の各種データと連携。しかも、プログラミングは一切必要なく、利用できるという特徴がある。RやPythonでの拡張も可能になっている」とした。

 さらに、Cortana Intelligence Cloud Service Galleryでは、AIの導入のハードルを下げるためのテンプレートを用意。金融のアノマリ解析、製造ラインの設備保守など、用途に対応したテンプレートがある。さらに、「Microsoftが提供しているテンプレートだけでなく、サードパーティが提供するテンプレートも用意している」という。Azure Machine Leaningは、日本リージョンで稼働している。

 そのほか、日本におけるAIの活用事例として、博報堂がターゲティング広告システム「Face-targeting AD」を開発し、利用者の顔を認識して、年齢や性別、感情などを分析して、最適な広告を掲示するサービスを開始。疲れている顔をした人には栄養ドリンクの広告を表示することが可能になったという。

 またエイベックス・グループ・ホールディングスでは、来場者分析システムを開発。来場者の顔を認識して、ライブの盛り上がりを分析している。演奏している楽曲と、感情の関連性をもとに数値化するもので、エンターテインメントに対する効果測定を数値化することができたという。

 SBIでは、FX取引サービスの問い合わせにおいて、チャットボットを利用したサービスを開始した。深層学習を利用することで、顧客の行動や心理まで理解した対応を可能にしているという。

 そのほか、Microsoft Researchが海外で取り組んでいるパーキンソン病患者を対象にした「Project Emma」についても説明。リストバンドを作り、人ごとに違う震えのパターンを認識し、それによって、震えを押さえることで、線をまっすぐに引けたり、自分の名前を書けるようになったとした。

 榊原CTOは、「Microsoftのミッションである『地球上のすべての人々と、すべての組織が、より多くのことを達成できるようにする』ためにAIを活用したい」と述べた。

AIの民主化と社会の重要課題の解決のために、AI機能を導入していくという

毎年、利益の12~14%を投資

 なお、MicrosoftでAIの研究開発を行っているのはMicrosoft Researchであり、1991年の設立以来、26年目を迎えた組織だ。全世界に約10拠点を持つ。日本には拠点がないが、Microsoft Research アウトリーチとして、日本の研究者との接点を持つ役割を果たす組織がある。

 またマイクロソフト ディベロップメントが、Microsoft Researchの予算により開発活動を行っており、米国のサンタバーバラには、「ステーションQ」と呼ぶ、量子コンピューティングの専門研究機関がある。

 Microsoftでは昨年、AI&リサーチとAI研究の人員を統合。ここには、5000人以上の研究者が所属している。「AI関連の特許、論文の数は世界ではトップクラスである。累計特許数および論文数ではトップである」とした。

 また研究開発費として、毎年、利益の12~14%の投資が行われている。具体的には、1兆円強が研究開発(設備投資は除く)に投資されているという。

Microsoftの研究開発費
25年にわたるAIへの取り組み

 榊原CTOは、基礎研究に対する新たな取り組みについても説明した。

 「技術が誕生して、ビジネスにつなげるまでには、プロダクトイノベーションである『研究』、『開発』と、プロセスイノベーションである『事業化』、『市場投入』に分けられるが、昨今では、プロダクトイノベーションがプロセスイノベーションのなかに入ってきている。市場投入までの時間を短くし、小さい単位でサービスをリリースする『リーンスタートアップ』が重視されている。だが、これまではプロセスイノベーションにおいても、基礎研究の部分は聖域となり、ここに組み込まれにくい環境にあった。だが、Microsoft Researchは、ここも変えようとしている。現在Microsoft ResearchでAIを研究している研究者のなかには、社会学者、経済学者、心理学者、言語学者が所属しており、分野横断型でのシナジーを生もうと考えている」などと述べた。

 なおMicrosoftでは9月25日~29日まで、米国フロリダ州オーランドで技術者向けイベント「Microsoft Ignite」を開催し、AI関連技術やサービスなどを数多く発表することになるという。