ニュース

Snowflake、文書からより深い洞察を引き出す新しい大規模言語モデル「Document AI」を発表

Microsoftとのパートナーシップも拡大

 Snowflakeは、独自の大規模言語モデル(LLM)として「Document AI」を発表。プライベートプレビュー版として提供を開始する。文書からより深い洞察を引き出す新しい大規模言語モデルと位置づけており、米Snowflake 製品担当上級副社長のクリスチャン・クレイナマン(Christian Kleinerman)氏は、「Document AIにより、自然言語で質問をし、ドキュメントからさまざまな回答を抽出できる。ドキュメントが利用しやすいプラットフォームにSnowflakeを進化させることができる」とした。

米Snowflake 製品担当上級副社長のクリスチャン・クレイナマン氏

 また、Microsoftとの提携を拡大し、Azure OpenAIやAzure MLなどをSnowflakeのサービスに統合して利用できるようにすることを発表。データクラウド環境における大規模言語モデルと機械学習機能の強化を図る。

 さらに、NVIDIAとの戦略的パートナーシップを締結し、同社によるAIモデルや大規模言語モデルのフレームワークを企業に導入できるようにした。Snowflakeのデータをフル活用することで、大規模言語モデルを最適化。生成AIをエンタープライズレベルで活用できるようになる。これにより、大規模言語モデル開発用のNVIDIA NeMoプラットフォームとNVIDIAGPUをベースにしたアクセラレーテッドコンピューティングを利用して、あらゆる規模の企業が、独自データを使用したカスタム生成AIアプリケーションを、Snowflakeのデータクラウド内で安全に作成できるという。

 これらは、同社が6月26日から29日(現地時間)まで、米国ラスベガスで開催している年次イベント「Snowflake Summit 2023」において発表したもので、同イベントでは、同社のフランク・スルートマン会長兼CEOによる基調講演のほか、400を超えるセッションを用意。中でもデータと生成AIを活用したトラックが多数用意されている。また、日本における事例として、コカ・コーラ ボトラーズジャパンの取り組みが紹介されている。

Document AIとは?

 Document AIは、2022年8月に買収を発表したApplicaの技術を活用している。

 「Document AIは、抽出することに優れており、構造化、半構造化、非構造化のいずれのデータからも、自然言語を使って回答を抽出し、より分析に活用しやすい環境を構築できる。大規模言語モデルのパワーをデータクラウドにもたらすことができる」とする。

 機械学習の専門知識がなくても、文書から分析価値を簡単に抽出できるようになり、スピード、精度、シンプルさを向上させ、中でも、データの90%以上を占めると言われる文書、画像、動画、音声などの非構造化データの分析と価値の抽出を高度化できる点を強調した。

Document AI

 クレイナマン上級副社長は、「Snowflakeは、生成AIが幅広く採用される前から大規模言語モデルに着目しており、Document AIによって、生成AIのエクスペリエンスをサポートできるようになった。自然言語で質問し、自動的に回答を取得することができる。企業はセキュアな環境において、大規模言語モデルの推論を活用でき、オプションにより、モデルの微調整も可能になる。AIを活用することで、フォーマットや場所などに縛られていたサイロを排除でき、新しいデータ時代を切り拓くことができる」と語る。

 具体的なユースケースとして次のように説明した。「PDFの文書に質問を投げかけたり、答えを抽出できたりする。例えば、この契約書にサインしたのは誰かを聞いてみるといったことが可能だ。非構造化データであったとしても、Snowflakeのなかで、直接答えられる。また、テキストからSQL文に変換して、それを活用することもできる」。

 自然言語によって、請求金額や契約条件などのコンテンツを文書から簡単に抽出し、ビジュアルインターフェイスによるダッシュボードなどに、結果を表示できるようになる点も示す。さらに、「さまざまなモデルを組み合わせることで、イメージに対しても、問い合わせをしたり、審査したりといったこともできる」とも語った。

Microsoftとのパートナーシップを拡大

 一方、Microsoftとのパートナーシップの拡大では、生成AIやローコード/ノーコードアプリケーション開発、データガバナンスなどを統合。共同ソリューションの提供を進める。

 Snowflakeが持つデータクラウドの専門知識と、Microsoftが持つAIやクラウドを組み合わせて、さまざまな業界の顧客がデータをより適切に管理、理解、管理できるインテリジェントソリューションを構築できるという。

 具体的には、SnowflakeのデータクラウドとAzure MLを統合したサービスを提供し、最新のフレームワークや、統合されたCI/CDなどにアクセスして、機械学習の開発から運用ワークフロー全体を加速するほか、Snowflakeのユーザーがデータを活用し、Azure OpenAIおよびMicrosoft Cognitive Servicesを活用できるようにする。

 製品統合では、データガバナンスのためのPurviewや、ローコード/ノーコードアプリケーション開発のためのPower AppsおよびPower Automate、ELTのためのAzure Data Factory、データの視覚化のためのPower BIなどが含まれる。

 Snowflakeでは、今回の「Snowflake Summit 2023」を通じて、Microsoftとのパートナーシップや、NVIDIAとの提携を発表したように、同社独自の大規模言語モデルであるDocument AIに限定せずに、さまざまな大規模言語モデルを活用できるようにする姿勢を示している。

 クレイナマン上級副社長は、「Snowflakeのプラットフォームには、どんな大規模言語モデルであってもホスティングすることができ、さまざまなユースケースを実現できる」と語った。

 また、スノーフレイク シニアプロダクトマーケティングマネージャー兼エヴァンジェリストのKT氏は、「お客さまが最適な環境で利用できるように、さまざまなバリエーションを用意しているのがSnowflakeの基本姿勢であり、それは、生成AIも同様である。Snowflakeで大規模言語モデルを使用する際に、これまでに大規模言語モデルを使用していなかったユーザーにも、Snowflakeが提供する大規模言語モデルをすぐに利用できる環境が用意されることになる。Snowflakeのスキルセットを持っている人であれば、Document AIをネイティブで利用できる点はメリットになるだろう」とする。

スノーフレイク株式会社 シニアプロダクトマーケティングマネージャー兼エヴァンジェリストのKT氏

 一方で、「すでにパートナー企業の大規模言語モデルを使用している場合は、わざわざSnowflakeの大規模言語モデルに移行しなくても、そのまま利用できる環境を用意する。大規模言語モデルの裏側のデータを、Snowflakeにするといったことができる。Document AIの詳細な機能については今後明らかになってくるが、もし、Snowflakeの大規模言語モデルでカバーできない部分があれば、パートナーの大規模言語モデルを活用できる。選択肢を用意しているのがSnowflakeの特徴である」と述べた。

今後の生成AIの進化は?

 Snowflakeでは、今後の生成AIの進化についても言及している。

 同社では2023年5月に、生成AIや検索エンジンに特徴を持つNeevaの買収を発表しており、これも同社の生成AIの取り組みにおいて重要な意味を持つとする。

 クレイナマン上級副社長は、「大規模言語モデルの課題は、クエリに対する回答を出す際に、正しい回答が出てくるわけでははないという点だ。そこには、幻覚を生み出す可能性がある。だが、従来の情報を取り出す技術と、大規模言語モデルを統合することで、対話型のエクスペリエンスを実現し、自然言語をサポートし、精度や妥当性を確認することができる。検索エンジンは大規模言語モデルによって強化される。Neevaの技術を活用することで、生成AIを進化させることができる」などと述べた。

 さらに「Streamlitに対する投資を行い、生成AIを活用した対話型プログラムの実現が可能になる。また、対話型のエクスペリエンスは、マーケットプレイスにも展開されることになる。継続的に投資をすることで、Snowflakeのプラットフォームが強化され、アプリケーションの生成だけでなく、セキュリティやプライバシーを犠牲にすることなく、生成AIを活用する環境が整う」などとした。

LLMおよび生成AIプラットフォームとしてのSnowflake

最新機能が日本でも利用可能

 Snowflake Summit 2023では、Document AIやMicrosoftの提携強化、NVIDIAとのパートナーシップのほかにも、Native App Frameworkに関するアップデートや、Snowparkにおける開発者のプログラマビリティの拡張、Iceberg TablesへのApache Icebergの選択肢の追加など、数多くの発表が行われている。

 これらについて、スノーフレイクのKT氏は、「新たに発表されたサービスや技術の多くは、日本のクラウドリージョンにおいても、遅れることなく適用する予定である。日本のお客さまが、世界の最新機能をタイムリーに活用することが可能である。新機能をどんどん活用してほしい」とする。

 すでに日本においても、Native App Frameworkなどのプライベートプレビュー版を活用して、実験的に実装しているパートナーがあるという。

 「最新機能が日本でも利用できるということは、日本の企業が後追いでなく、世界をリードする存在として、牽引していける可能性があることにつながる。日本のDXが遅れているといわれる時代は終わることになる」とコメント。「日本発のアイデアによるアプリケーションがSnowflakeのワンプラットフォームによって、労せずして世界に羽ばたいていくことも可能になる」と語った。