ニュース
データ流通・利活用の課題解決へ――、「AIデータ活用コンソーシアム」が発足
AI研究者・教育機関・事業者が連携
2019年3月7日 11:26
AIの研究およびデータの利活用を行う教育機関、事業者は、AI研究の隆盛にともない急速に高まりつつある大量・高品質のデータへのニーズに応えるため、AI研究やデータ流通、研究基盤の構築をオールジャパンで取り組む「一般社団法人AIデータ活用コンソーシアム」を設立し、4月から活動を開始する。
3月6日に行われた設立発表会では、AIデータを取り巻く課題やコンソーシアムの活動内容などについて説明した。
日本におけるAIの研究・活用を加速させる
AIデータ活用コンソーシアムは、京都大学、ギリア株式会社、国立国語研究所、一般社団法人日本電子出版協会、東京大学、東洋大学、豊橋技術科学大学、日本財団、一般社団法人日本支援技術協会、日本マイクロソフト株式会社、株式会社ブリックス、株式会社ブロードバンドタワー、理化学研究所、株式会社Ridge-iが参画。研究者・教育機関・事業者が組織の垣根を越えて一丸となり、日本におけるAIの研究と活用をさらに加速させるための活動を推進していくという。
コンソーシアムの会長には、長尾真氏(元京都大学総長/元情報通信研究機構理事長/前国立国会図書館長/前国際高等研究所所長)が就任。また、副会長には渡部俊也氏(東京大学 政策ビジョン研究センター 教授/副センター長大学執行役・副学長)(知的財産・契約担当)、杉山将氏(理化学研究所 革新知能統合研究センター センター長、東京大学 大学院新領域創成科学研究科 教授)(研究担当)、井佐原均氏(豊橋技術科学大学情報メディア基盤センター センター長・教授)(データ活用担当)、田丸健三郎氏(日本マイクロソフト 業務執行役員 NTO)(データ基盤担当)が就任した。
設立発表会で挨拶したAIデータ活用コンソーシアム会長の長尾真氏は、「今後AIを発展させていくためには、AIに関係する各分野の基本データをしっかり集め、それを活用してスマートなAIシステムを構築していく必要がある。しかし、日本では、AIに関わるデータ形式やライセンス契約などがバラバラであり、有効活用しきれていないのが実状だ。このままでは、AI先進国の中国や米国から大きく引き離されてしまう。そこで、当コンソーシアムでは、日本に存在しているあらゆるAIデータを自由に使って、AIシステムを様々な分野で展開していくための基礎作りに取り組む。AIデータの取得から研究開発、オープンイノベーション、そして社会課題を解決するアプリケーション提供までのサイクルを回すことで、AIの発展に貢献していく」との考えを述べた。
データの共有・取引基盤、流通・活用のための仕組みなどが不足している
次に、コンソーシアム設立の背景として、国内におけるAIとデータを取り巻く課題について、AIデータ活用コンソーシアム副会長(研究担当)の杉山将氏が説明。「日本では、AI研究およびビジネス活用を前提とした、業種を超えた多様なデータの共有、取引基盤が全く整備されていない。また、日本語データや日本文化固有の画像データ、日本の地域固有データが圧倒的に不足しているため、海外データによる偏ったAIモデルになってしまう」と指摘する。
「さらに今後は、複数のモダリティによるモデル構築を行っていくことが重要になる。日本の言葉は常に変化し続けており、例えば、10年前と今とでは10代の使用する言葉は大きく異なる。『やばい』という言葉の意味は、テキストや音声データだけは評価できず、行動データとの組み合わせることで初めて評価することが可能になる」とした。
また、国内のAIデータは、流通・活用の面でもさまざまな課題を抱えているという。AIデータ活用コンソーシアム副会長(データ基盤担当)の田丸健三郎氏は、「現在、AIデータを活用するためには、データホルダーごとに費用や契約などの交渉、手続きが必要であり、AI活用を目的としたデータの商取引における契約モデルが欠如している。そのため、AIデータにおける公正な取引環境の実現が求められている。さらに、『物』とは異なり、データの品質保証が難しいことに加え、価値あるデータの収集が非常に困難である点も課題として挙げられる。これには、データを持つ企業の課題解決と、AIの知見・頭脳を持つ研究機関・AIスタートアップの相互補完が必要になる」と述べた。
こうした背景を踏まえ、今回、日本国内に特化したAIデータの流通・活用促進に向けてAIデータ活用コンソーシアムが発足。「コンソーシアムでは、『知的財産』『法令』『データ共有基盤』の3つをテーマとし、AIデータ活用における課題の検討および解決に向けて作業部会(WG)を設置。AIの研究開発、ソリューション実現に寄与していく」(田丸氏)という。
コンソーシアムが目指す姿とチャンレンジ
具体的に、同コンソーシアムが目指す姿とチャレンジとしては、円滑なデータ流通を実現するための知的財産、契約モデルを構築。AIデータ利用・提供に係る価格交渉から権利関係の整理、契約手続き、セキュリティ・認証までを同コンソーシアムがワンストップで対応し、手続きを簡素化することを目指す。
コミュニティの育成として、AI・データの利活用に携わる高度な人材による協働と共創を促進するため、ユーザー企業、AI研究者、およびAIスタートアップの会員間連携によるネットワーキングとマッチングの場を提供する。
また、ニーズに応じたAIデータ収集・提供モデルとして、「媒介のみの提供モデル」と「データ管理型の提供モデル」の2つのAIデータ活用基盤を構築し、データホルダーやデータ利用者に提供していく。
さらに、同コンソーシアムの会員向けに組織内データ流通、共有基盤を構築する。これにより、独自に基盤を構築するケースと比べ、大幅にデータの利活用にかかるコストを低減する。また、組織の垣根を越えて無償・有償で提供されるデータへのアクセスを容易にすることで、これまで困難だった複数のモダリティによるモデル構築を実現する。
なお、パイロットプロジェクトとして、公共交通オープンデータ協議会と連携し、プロトタイプスタディの構築を進めていくという。公共交通オープンデータセンターに収集される様々な交通データを、インターネットなどを通じて、標準プロトコルや標準データ形式で提供。複雑な商流・用途に対応した諸手続き、メータリング、法令対応により、円滑なデータ流通の実現を目指す。