Infostand海外ITトピックス

「モダンデータスタック」の時代へ DatabricksとSnowflakeのデータ戦略

Databricks:MosaicMLを取得し、生成AIモデルの構築を支援

 6月26日の週、サンフランシスコではDatabricksの「Databricks Data + AI Summit 2023」、ラスベガスではSnowflakeの「Snowflake Summit 2023」というイベントがそれぞれ開催された。

 それぞれの発表を見てみよう。

 Databricksはイベント初日、MosaicMLの買収計画を発表した。MosaicMLは生成AIプラットフォームを開発するスタートアップで、「MPT」というLLM(大規模言語モデル)を開発している。オープンソースで商利用可能な「MPT-7B」は5月はじめに公開され、ダウンロード数は330万回に達したという。

 「(両社が一緒になることで)あらゆる企業が生成AIを利用できるようになり、自社のデータを使って安全な生成AIモデルを構築、所有できる」とDatabricksは発表で狙いを説明している。

 このほか、生成AIツールの「LakehouseIQ」も発表した。「企業のビジネスとデータの微妙なニュアンスを学ぶナレッジエンジン」で、自社独自のデータやビジネスに関連した質問に答えられるという。DatabricksのUnity Catalog、ダッシュボード、ノートブックなどのシグナルを利用することで、ユーザーは自社に特化した高精度のモデルを構築できる。これは、一般的なLLMではカバーしきれないことだとする。

 また、オープンソースのデータレイク/データウェアハウス「Delta Lake」も最新のバージョン3を発表。Universal Format、Liquid Clusteringなどの機能を盛り込んだ。