大河原克行のクローズアップ!エンタープライズ
新メッセージ“AIデータクラウド”でデータ活用の何が変わる? 米Snowflake幹部に製品戦略などを聞く
2024年9月20日 06:00
Snowflakeが、「データクラウド」の企業から「AIデータクラウド」の企業へとメッセージを転換してから、約1年が経過した。AI駆動のデータプラットフォームと、データ駆動のAIプラットフォームによって構成される「AIデータクラウド」は、Snowflakeの成長を加速するとともに、顧客にとっては、データを活用するハードルを下げ、より多くの人が、簡単にデータを活用できる環境へと大きな変革をもたらすものになる。
Snowflake プロダクト EVPのクリスチャン・クレナマン氏は、「AIがコラボレーションを拡張し、すべての組織のすべての人がデータを活用できるようになる。AIがディスラプションを起こすことになる」と語る。Snowflakeのクレナマン氏に、AIデータクラウドへの取り組みを中心に、同社の製品戦略について聞いた。
専門家にしかできなかったことが容易にできるようになる
――Snowflakeは、2023年に、それまでの「データクラウド」の企業から、「AIデータクラウド」の企業になることを打ち出しました。この意味を教えてください。
2012年に設立したSnowflakeは、クラウドの力を活用して、データプラットフォームを構築し、データを分析するサービスからスタートしました。2018年からは、コラボレーションによる変革を進め、データにシームレスにアクセスし、データクラウドとしての役割を果たすようになりました。そして、2022年にはアプリケーションプラットフォームを構築し、データ活用を目的としたアプリケーション開発における改革を実現しています。
これをさらに進化させたのがAIの採用です。これによって、SnowflakeはAIデータクラウドの世界を実現していくことになります。ここでは、お客さまがAIソリューションを構築することを支援する取り組みと、SnowflakeがAIを活用してプロダクトをより良くしていく取り組みの2つがあります。
例えば、データクラウドにAIソリューションを組み合わせると、これまでとは異なるコラボレーションを生み出すことができます。そして、コラボレーションのやり方そのものもAIで向上させることができます。また、ユーザーがSnowflakeマーケットプレイスを訪れると、1年前はデータプロダクトに対して、SQLを書いて、データを理解して、評価する必要がありましたが、いまは自然言語で記述すれば、AIが解釈し、生成してくれます。
この変化は非常に重要なものです。「データクラウド」が、「AIデータクラウド」へと更新されることで、AIがコラボレーションを拡張し、より多くの人が、より簡単に、データを活用できるようになります。言い換えれば、AIによって、すべての組織のすべての人がデータを活用できるようになります。
もともとデータは、IT部門などの一部の人たちが使っているものでした。データ分析の結果をもらうまでに1週間かかるということも、かつては日常的でした。その後、BIが登場し、より多くの人がデータにアクセスし、分析ができるようになりしたが、データに関する一定の知見やスキルを持った人たちが利用の中心でした。どのダッシュボードで、どのチャートを見て、どうやって数値をとらえるべきかというノウハウが必要とされていたからです。
しかし、AIを活用することでそうしたことも不要になり、より多くの人がデータを活用でき、AIに質問すれば、必要な回答を得ることができます。データエンジニアやMLエンジニア、SQLアナリストだけでなく、ビジネスユーザーであっても、データの価値を享受できるようになるわけです。これは、企業がデータドリブンになるためには重要な要素といえます。
私は、AIがディスラプションを起こすことになると考えています。それは、テクノロジーを使える人のハードルをAIが下げ、より多くの人がテクノロジーを活用できるようになるからです。メールボックスのなかからスパムメールだけを分類したいという仕組みを構築するにも、これまでのテクノロジーのままでは専門的な知識が必要でした。
しかし、AIを活用することで、専門家にしかできなかったようなことが、専門的なスキルを持っていない多くの人たちでも行えるようになります。そして、Snowflakeが提供するAIも日々進化しています。Cortex AIも1年前はできなかったことができたり、できたけど難しかったことが簡単にできたりといったことが起きています。これは、単に生産性を高めるというだけでなく、世界的な課題となっているデータサイエンティスト不足を解消することにもつながります。
“AIデータクラウド”企業としての認知はまだまだ
――Snowflakeが「AIデータクラウド」の企業であるという認知は、この1年で高まりましたか。
それはまだまだです。Snowflakeを利用していないお客さまのなかには、「Snowflakeは、データアナリティクスの会社である」という認識のままの方も多くいます。私たちの進化のスピードは、さらに加速していますから、データクラウドからAIデータクラウドへと更新したことで、お客さまやパートナーに、どんなメリットをもたらすことができるのかといったことを、もっと発信していかなくてはなりません。
現在、Snowflake World Tourを全世界で展開しており、それを通じて、AIデータクラウドを全世界に発信していくことが重要だと考えています。例えば、東京で開催したSnowflake World Tour Tokyo 2024を訪れたお客さまからは、Snowflake Copilotによって、自然言語でSQLを生成することができることを初めて知ったという声がありました。SnowflakeがAIのためにも活用できるということを初めて理解できたという声もありました。
Snowflake World Tourでは、Snowflakeが持つビジョンをきちんと説明するとともに、進化しているプロダクトを知ってもらうこと、それをもとにお客さまやパートナーからのフィードバックを得て、それを次の製品開発に生かしていくことが狙いとなります。
――「データクラウド」の広がりを推し量る指標としては、ステーブルエッジがあります。「AIデータクラウド」の浸透を推し量る指標は何になりますか。
指標のひとつは、Snowflake全体の顧客数ということになります。そしてもうひとつが、1日あたりのジョブ数となります。さらに、ステーブルエッジの数も重要な指標であるととらえています。ステーブルエッジは、6週間以上に渡り、企業同士がアクティブにデータ共有を行ったり、アプリケーションを活用していたりする状態を指しており、Snowflakeがデータを通して、企業同士をつなげていることの裏付けとなります。
ステーブルエッジの状況を分析すると、データの共有やアプリケーションのシェアといった用途だけでなく、AIやMLの共有といったことも含まることになります。AIに基づいたコラボレーションが、ステーブルエッジのなかで広がっていくというわけです。現在、1万以上の顧客数、1日50億以上のジョブとなり、ステーブルエッジは8300以上となっています。AIデータクラウドの広がりととも、これらの数値が増えていくことになります。
最も力を入れる投資領域は?
――Snowflakeでは、データ、コンピュート、セキュリティおよびガバナンスによる基盤を構築し、その上に、パイプライン、アナリティクス、機械学習、生成AI、データプロダクトといったコアとなるケーパビリティを提供する仕組みとしています。投資という観点で、最も力を入れるのはどこになりますか。
Snowflakeが提供しているコアとなるワークロードは、伝統的なアナリティクスの領域と、データエンジニアリングの部分、そしてAIの3つとなります。これらは、今後も、Snowflakeが継続的に投資をしていく領域だといえます。
投資額という点では、アナリティクスおよびデータエンジニアリングの領域が大きく、AIの投資規模はそれに比べると大きくはありません。しかし、この3つの領域は重要な投資領域ですし、コアエンジンは、アナリティクスにも、データエンジニアリングにも、AIにも関わることになりますから、切り分けるのが難しい部分もあります。
さらに、組織全体としてダイナミックに変化していくことを重視していますから、投資額のターゲットを決めて、そこに固定するのではなく、より機動的に対応していくことを優先します。お客さまの声を聞いて、この領域への投資を加速させなければならないということがわかったら、リソースを入れ替えるなど、柔軟に対応していくことになります。
――ここにきて、セキュリティおよびガバナンスに関する発信を強化していることを、特に強く感じます。
確かにそうかもしれません。ただ、セキュリティおよびガバナンスに対しては、創業当初から最も重視してきた取り組みであることも強調しておきます。Snowflakeは、2人のフランス人によって創業されましたが、創業者以外で初めて採用した3人目の社員は、セキュリティアーキテクトでした。機能を作り込む前に、どうやってデータをセキュアに扱うかということを考えていたことがここからもわかると思います。
つまり、Snowflakeの文化は、セキュリティを重視しながら醸成されてきたわけです。アナリティクス、データエンジニアリング、AIのすべてを支えるのが、セキュリティ、ガバナンス、プライバシーの強化です。これまでのSnowflakeの成長を支えてきたのは、お客さまからの信頼につきます。セキュリティが前提となって初めて、Snowflakeが提供する機能が、お客さまに評価していただけます。Snowflakeは、センシティブなデータを保存し、それを管理しています。ルールで厳しく規制された企業のデータも取り扱っているわけです。お客さまがSnowflakeを信用し、信頼してくれなかったら、ここまで成長することはできませんでしたし、これからも、セキュリティ、ガバナンス、プライバシーは最優先課題として強化していくことになります。
「データ体験」を通じて、機会を作り、それを実現するために必要な作業を減らし、企業が新たなビジネスモデルを考えることに時間を割くことを提案します。Snowflakeは、テクノロジーやデータを、企業のコストセンターに対して提供するのではなく、収益をあげることができる機会として提供したいと考えています。つまり、Snowflakeが目指す役割は、単にベンダーとしてテクノロジーを売るのではなく、お客さまにとって、新たなビジネスの機会を作るためのパートナーであり続けることです。
クオリティが高いデータプロダクツをマーケットプレイスにそろえることが重要
――Snowflakeマーケットプレイスでは、2400を超えるデータプロダクトが提供されています。ただ、日本の企業はデータを出したがらないという傾向があります。その点は改善されているのでしょうか。
データを収益化することや、データを共有することに対して、懸念を持つ企業が多いことは理解しています。Snowflakeマーケットプレイスでは、どのリージョンにデータプロダクトを配信するのかを選択できるほか、詳細を提供したくない場合には、それを制御したり、匿名化したりといったことも可能です。利用に関するポリシーを添付することもできます。
いまから6年前に、データの収益化の話をしたら、世界中の企業に拒否反応がありました。この間、Snowflakeはデータクラウドの価値を訴求し、それを理解してもらうための活動を進めた結果、業界全体やお客さまの認識が変化してきました。多くの企業がデータの価値を理解するようになり、データの収益化に対する関心も高まりました。6年前よりも1年前の方が、データの収益化の理解は100倍以上進んでいますし、1年前よりも今の方が、さらに理解が大きく進展したといえます。
――Snowflakeマーケットプレイスで提供されるデータは、今後も増えていくのでしょうか。
実は、多くのデータプロダクトをSnowflakeマーケットプレイスに出したいとは思っていません。大切なのは、効率性が高く、利用した企業にとってメリットがあるものをそろえることです。
私は、Snowflakeに入社する前に、YouTubeに勤務していました。YouTubeはいまでも私の大好きなサービスのひとつです。しかし、Snowflakeマーケットプレイスで目指しているのは、YouTubeではなく、Netflixです。YouTubeは膨大なコンテンツがありますが、素晴らしいコンテンツも多いが、そうではないコンテンツも数多く含まれています。素晴らしいコンテンツを探し出すのが難しいという課題も出ています。それに対して、Netflixはコンテンツ数が限られていますが、すべてのクオリティが高い。
Snowflakeマーケットプレイスも、それと同じで、クオリティが高いデータプロダクツをそろえることが重要です。これは、データアナリティクスやデータエンジニアリングにおいて重要な要素であるというだけでなく、今後、AIにおいてデータを活用する際にも、重要な要素となります。信頼性が高く、品質が高いデータを活用できるように、量よりも質を重視していくというのが、私たちの姿勢になります。
年次イベントで発表された注目すべきプロダクトは?
――2024年6月に、米国サンフンシスコで開催したSnowflake Data Cloud SUMMIT 2024では、数多くの製品を発表しました。特に注目しておくべきプロダクトはなんでしょうか。
私の立場からは、どれかひとつを選ぶということはできませんが(笑)、特に注目してもらいたいのは、SnowparkとCortexです。Snowparkはデータパイプラインや機械学習モデル、アプリケーションなどの開発を可能にする開発フレームワークであり、この分野において、破壊を起こすことができたといえます。多くの組織がデータトランスフォーメーションにSparkを使っていたわけですが、Snowparkを使うことでこれまでにないパフォーマンスやコスト削減が可能になることに、多くの人が気づき始めています。実際、SnowparkとSparkのパイプラインを比較すると、パフォーマンスは4.6倍高く、コストは35%も削減できます。
また、Cortexは、AIの可能性を解き放つものであり、次世代のデータの民主化を促進することができます。Cortex AIでは、モデルとチャット、スタジオの機能をスイートとして提供することになります。
――現在、パブリックプレビューで提供しているSnowflake Notebookには、早くも高い評価が集まっているようですね。
Snowflake Notebookは、Snowflakeの優れた機能を、使い慣れたノートブックインターフェイスに統合するために設計したもので、PythonやSQL、Markdownのほか、Snowpark ML、Streamlit、Cortex、Icebergテーブルなどの主要なSnowflake製品とシームレスに融合し、便利で使いやすいインタラクティブ環境を実現します。
データサイエンティストやデータアナリストは、毎日の仕事をノートPCで行っています。Snowflake Notebookを使用して、データへの接続プロセスを簡素化し、データエンジニアリング、アナリティクス、機械学習のワークフローを強化できるようになります。これは、多くの方々からリクエストをもらっていた機能です。すでに、お客さまの10%以上が本番環境でSnowflake Notebookを利用すると決めているほど、GAの前から高い評価が集まっています。今後2カ月でGAになります。
――Snowflakeでは、Apache IcebergのためのオープンソースカタログであるApache Polarisの提供を開始しました。反響はどうですか。
多くの大手企業は、相互運用性を実現するIcebergテーブルを利用したいと考えています。しかし、オープンファイルフォーマットを使うと、それに対する責任を自ら持たなくてはならないため、それを課題に挙げる企業もあります。その部分をSnowflakeに委ねたいという声も上がっています。
Icebergは業界のスタンダードになっています、Apache Polarisによって、Snowflakeは、データテクノロジーの相互運用性において、強いコミットメントを行うことができました。AWSやMicrosoft、Google Cloud、Salesforceなどの大手プレイヤーにデータがロックインされない環境の実現に継続的に投資をしていきます。Apache Polarisの提供はその点でも重要な取り組みのひとつに位置づけています。
日本企業からは「もっとアドバイスしてほしい」という要望が寄せられている
――2024年2月にSnowflakeのCEOにスリダール・ラマスワミ氏が就任しました。社内に変化はありましたか。
はい、変化がありました。その変化はいい方向に向かっていると思います。より早くお客さまに対応すること、より早くプロダクトを投入することへの意識が高まり、スピードや危機感に対する姿勢が変化しました。また、データに対して、よりフォーカスし、よりデータドリブンに焦点をあてる意識が高まりました。さらに、プロダクト開発チームと営業チームを、より密接に協力させるための変革も始まっています。Snowflakeは、これまで以上に、多くの製品と機能を提供する組織へと拡大しています。開発戦略と営業戦略をより連携させることに取り組んでいます。
――今後、日本の市場に対して、今後どんな取り組みをしていきますか。
私自身、この8カ月間で東京には3回来ています。今回の来日でも多くのお客さまと対話をすることできました。1年半前には、Snowflakeのことを学びたいと言っていたお客さまが、今回の来日では、Snowflakeによって、こんなことができたと喜んでくれました。そこでは、Snowflakeがパートナーとなって、一緒にどんな価値を作り上げることができるのか、といったことを新たに議論したところです。
日本のお客さまと話をしていると、「もっとアドバイスしてほしい」という要望が多いですね。データやAIをどう扱うべきかといった点で悩んでいるようです。これからは、AIを活用するかしないかで、企業の成長や競争力には大きな差が出てくることになります。日本の企業に、データとAIをプロセスに活用してもらうため、より密接な対話を行い、一緒になって考えていくつもりです。アドバイスが欲しいという声が上がるのは、Snowflakeとお客さまとの間に信頼関係が構築できているからだと思っています。営業チームやソリューションエンジニアチームを通じて、日本のお客さまとより緊密な関係を持ちたいと考えています。
日本におけるお客さまの数は着実に増加しています。それによって、Snowflake Japanも成長しています。お客さまとの信頼関係が構築できていますし、Snowflakeの価値を理解してもらっています。日本における成長には大きな期待を持っています。