ニュース

AI主権を整理してプライベートAIの検討軸を明確化、NTTデータ先端技術が解説

 NTTデータ先端技術は2日、プライベートAIに関するプレスセミナーを開催した。

 生成AIの本格的な業務適用が進んでいるが、外部クラウドのAIで自社の情報を扱うことに不安を感じる企業は多い。そこで注目されているのがプライベートAIだ。現時点ではプライベートAIについて明確な定義がないが、NTTデータ先端技術ではどのような観点で製品比較をすればいいかを、経営層向けに整理した。その内容を、NTTデータ先端技術 基盤ソリューション事業本部 テクノロジーファウンドリー事業部長の小津美夕紀氏が解説した。

NTTデータ先端技術の小津美夕紀氏

AI主権(ソブリンAI)とはそもそも何か

 プライベートAIとは何かを問う前に、まずはAI主権について整理する。というのは、プライベートAIは自社でさまざまなことがコントロール可能、つまり主権がある状態のはずだからだ。

 「AIの民主化」によって、誰でもAIが使えるようになった。とはいえ、AIインフラ市場は、ハイパースケーラーが中心となり、その周辺にエコシステムが広がる構造になっている。ハイパースケーラーのクラウド利用にはメリットもあるが、構造的なリスクもある。ハイパースケーラーの言いなりになるしかない状態は、「主権がある」とは言えない。

メリット

 ・強力なGPUインスタンス
 ・マネージド機械学習サービス
 ・グローバルな配置インフラ
 ・初期投資・運用負担の大幅軽減

構造的なリスク

 ・ベンダーロックイン
 ・規約変更への従属
 ・値上げへの対抗手段欠如
 ・地政学的遮断リスク

 AI主権という言葉が広く使われ始めたのは2023年頃からのようだ。きっかけのひとつはNVIDIA CEO ジェンスン・フアン氏の「Sovereign AI」という概念の提唱だと言われる。ただし、AI主権に「正式な定義」はない。そこで、製品の比較軸として分かりやすいように、小津氏はデータ、インフラ、モデル、運用」の4つに分解した。

AI主権を分解する

 重要なのは、主権は単純な「ある/ない」ではないということだ。4つそれぞれが独立した存在であり、それぞれに無数の選択肢がある。

 「さまざまな観点が混ざっていて、『これをすればレベル○』のような簡単な話ではない」(小津氏)。

 また、すべての軸を同時に深く揃えることが「主権を守る」ことではないという。データを本当に深く守るには閉域化が必要だし、インフラにはデータセンターや電力を含めた巨額の投資、モデルにはモデル開発能力、運用には運用人員の確保が必要となる。すべてを深い段階で揃えるのは、非常に困難だ。

 現実的なのは、自組織にとって最も重要な主権はどれかを意識的に選び、そこにリソースを集中させること。つまり、どの軸はどこまで追求するか決定し、それを実現できる製品を選定することが、AI主権ということだ。

 「何を選び、何を選ばないかを決めることが主権の行使だ」(小津氏)

「ソブリン」という上位概念を、段階に落とし込む

 ソブリンの語源をひもとくと、誰にその権限があるのかを問う言葉だ。そして、「所有している」と「自分で決められる」は同じではない。

 例えば、外資クラウドの専有環境にデータを置けば、見かけ上は自社のリソースとして、契約上の隔離は確保される。しかし、契約自体が外資法の管轄下にあるなら、ある状況においては強制開示の対象になりうる。このように、外部からの強制や干渉に対して、最終的にコントロールできるのは「誰」かという問いに正面から向き合うための上位概念が「ソブリン」である。

 ソブリンを語るには、2つの軸がある。

・所在(Location)
 守りたい対象が物理的・法的にどこにあるか。

・介入度(Intervention)
 守りたい対象に対して自組織がどこまで手を入れられるか。アクセス権・所有権を誰が持ち、学習プロセスをどこまでコントロールできるか。

 先ほど分割した4つの主権それぞれについて、権限の深さを段階で示したのが以下の図だ。

 データ主権は、データがどこに置かれ、誰がアクセス権限を持つかで、段階分けされる。図に示した段階で終わりではなく、その先に暗号化と鍵管理の自律性、データの来歴管理、破棄の確実性など、さらに深くなっていく。

データ主権

 インフラ主権は、AIを動かす物理基盤がどこにあり、誰が所有するかという観点で段階分けされる。さらに、半導体の調達、サーバーの製造、電力供給網の確保まで自前で抑える領域へ、限りなく深い段階があることが分かっているが、そこに至るには桁違いの投資と覚悟が必要となる。

インフラ主権

 ここでは学習の重みで段階を分けているが、これが一般的ということではなく、ソブリンの観点に合わせて段階分けしている。ちなみに、LLMは「中立な道具」ではない。振る舞いは、学習データの分布で決まるからだ。モデル主権をどこまで握るかは「何を学習させ、誰が決めるか」であり、文化的前提を自分たちでどこまで管理したいかという問いと直結する。

モデル主権

 運用主権は、データ・インフラ・モデルそれぞれに介入権限の深さという段階がある。

運用主権

4つの主権の段階を構成例に当てはめる

 4つの主権の各段階を定義したが、構成例に当てはめるには、さらに3つの問いがある。

①Who:誰の主権として見るか
②What:何を、どの段階まで守るか
③How:どう実現するか

 ソブリンは「誰にその権限があるか」ということだが、AIでは提供社の視点と利用者の視点がある。そもそも誰の主権かを定めなければWhat(段階)もHow(製品)も具体化できないので、ここでは利用者側の視点で論じる。

 Whatは「要件」の議論で、業務要件や事業に関する規制、コストの制約、リスクをどの程度受容するかに応じて、各軸でどこまで踏み込むかを決める。要件が決まってから、製品やアーキテクチャの選定に入る。この時、導入後どう運用するかも加味して決める必要がある。

 いくつかの構成例について、4つの主権がどの段階かを示してみよう。上の図と見比べながら見てほしい。

【例 1】ChatGPT等の汎用SaaS
 データ主権:共有環境・SaaS
 インフラ主権:共有基盤
 モデル主権:API利用のみ
 運用主権:介入権なし

【例 2】国内事業者のIaaS+オープンウェイトLLM(Llama,Gemma等)
 データ主権:法的主権下
 インフラ主権:国内事業者の物理基盤
 モデル主権:重み手元保有
 運用主権:法的規制下の判断権

【例 3】国内事業者運営のOracle Alloy/GDC connected/Azure Local
 データ主権:法的主権下
 インフラ主権:国内事業者の物理基盤
 モデル主権:-
 運用主権:法的規制下の判断権

【例 4】オンプレ基盤+国産モデル自社開発・運用
 データ主権:自社保有環境
 インフラ主権:自組織管理下サーバー
 モデル主権:学習プロセス支配
 運用主権:運用判断権の保有

 自社の要件によって、どの主権はどこまで追求するかを決定し、製品選定に入る(どのインフラに何を載せるか決める)というのがイメージできただろうか。

 ちなみに、運用主権には、コントロールプレーンという制約がある。製品によっては、自社で保有していても、システムの管理機能がベンダー側にあり、常時接続必須のものがある。実際のデータはベンダー側に行かなくても、管理用のメタデータが送信されていて、オフラインでも継続動作するが、管理操作はできないというものもある。製品による場合もあれば契約による場合もあるが、このような製品では、法的主権下にあっても運用主権が完全に保有できているわけではない。

 要点をまとめる。

  • 同じ段階でも選択肢に幅があり、基盤と載せるものを分けて考えるべき
  • AIを利用する側にとってのモデル主権は「学習プロセスを握れるか」にあり、外資か国産かは関係ない
  • 主権とはコントロール権を保持することであり、全部自前で保有しなければならないということを意味しない

 利用者側の視点であれば、全部自前でというのはかなりハードルが高く、信頼できる提供者の主権に乗るという選択肢が現実的だろう。

現実的な制約のなかで譲れない点を選び、技術で守る

 現実的な選択肢として、外部の基盤・製品を使うと割り切ることは、主権の放棄ではない。外部に譲った中から、本当に守りたい点を技術で取り戻せばいいのだ。その方法を、小津氏は3つの型に整理した。

①中身を守る=暗号化
 譲るもの: 所在・法域
 守るもの: 中身そのもの

 外部基盤にデータを置いても、暗号化し鍵を自組織だけが握れば、ベンダーには中身が読めない。強制開示要求があっても、開示できるのは暗号化された無意味なバイト列だけだ。

②集中を避ける=分散
 譲るもの: 単一基盤への一元化
 守るもの: 単一障害点・単一管轄の回避

 すべてをひとつの外部基盤に預けると、その基盤の障害・方針変更・法域の影響を丸ごと受ける。複数の基盤・主体に分散させれば、一社の都合に左右されない。

③制御を握る=自律
 譲るもの: 物理的な所有
 守るもの: 動かす判断の主導権

 基盤を自前で所有しなくても、「いつ動かし、いつ止め、どう変更するか」という制御の判断を自組織が握ることはできる。コントロールプレーンの議論はここに直結する。

 「主権の確保とは『全部を持つこと』ではなく、現実的な制約と天秤にかけ、譲れない点を選んで技術で確保すること」(小津氏)

 ここまでAI主権について分解・整理してきたが、「プライベートAIとは何か」に話を戻そう。プライベートAIは、特定の製品名や規格名ではない。小津氏の考えでは、データを外に漏らさず、自分たちのコントロール下でAIを使うための「考え方・仕組みの総称」のことだ。ポイントは、「どこに置くか」ではなく「どうコントロールするか」。すべてを自前で抱え込むことではないし、外資を完全に排除することでもない。

 「自組織にとって何が重要なのかを意識的に選び、その軸ではコントロール権を握る。それ以外の軸では、戦略的に他者と組む。この選択能力こそが重要となる」(小津氏)

INTELLILINK Private AI スタートパック

 最後に、NTTデータ先端技術が4月にリリースした「INTELLILINK Private AI スタートパック」について簡単に紹介しよう。

 これは、NutanixのAIプラットフォームを月額のリース契約(最低6カ月から)で提供するものだ。必要なサーバーやAIアプリケーションをあらかじめ設定した状態で届けるため、オンプレミスでありながら、クラウドのような簡単導入が可能。また、LLMは複数の中から選択可能で、NTTデータのtsuzumi2も選択できる。

INTELLILINK Private AI スタートパック

 用途としては、PoCは済んでAIが使えることは分かっているが、その先になかなか進めないという企業向けだという。本格導入するには、本番環境で実データを使ったテストが必要だが、機密データをクラウドに出すのは不安がある。しかし、多くの企業では、GPUが高価すぎていきなりインフラを調達できない。

 そのような企業が、AIを「どう業務に組み込むか」を確立するための、高度なステージング環境として活用することを想定している。Nutanixは、Air-gapped版で提供する。つまり、物理的にインターネットとの接続がない、完全な閉域環境ということだ。このため、機密データも安心して扱える。構築は、最短で1カ月程度だという。

 「位置づけは、単なるPoCではなく、“実戦配備の準備場”」(小津氏)

 本番環境でプロセス全体を確認して、本格導入が決まれば、それなりの投資が可能になる。実は、長期間使うのであれば、リース契約のスタートパックより、購入する方が安くつく可能性が高い。あるいは、やってみたが、これならクラウドでやった方がよさそうだという結論に至る場合もあるだろう。

 業務で本格的にAI活用するなら、本番と同じ制約下で、技術の動作確認だけでなく、組織がAIを実戦で使うプロセス全体の信頼性を確認する必要がある。「INTELLILINK Private AI スタートパック」は、それを可能にするソリューションとなっている。