ニュース

オラクル、インデータベースLLMを採用した「HeatWave GenAI」を説明し競合優位性を強調

 米Oracleのチーフ・コーポレート・アーキテクトであるエドワード・スクリーベン氏が来日し、グループ取材に応じた。Oracle CloudWorld 2024で発表したHeatWaveの新機能である「HeatWave GenAI」について説明。

 「HeatWave GenAIを利用することで、簡単に生成AIアプリケーションを開発できる。エンジニアがあらゆる分野の専門知識を有していなくても、パフォーマンスを出し、セキュリティが担保でき、高機能のアプリケーションを開発できるというHeatWaveの理念を実現するものになる」とコメントした。

 さらに、「HeatWave GenAIを発表して以降、HeatWaveの機能に生成AIを組み合わせたことに多くの注目が集まっている。生成AIから価値を生み出したいと思っているユーザーが、GenAIによって、その第一歩を踏み出すことができる。HeatWaveを通じて、よいアイデアを価値のあるアプリケーションにつなげることができる」などとも述べている。

米Oracleのチーフ・コーポレート・アーキテクトであるエドワード・スクリーベン(Edward Screven)氏

 HeatWaveは、HeatWave MySQLとして、OLTP、OLAPへの対応だけでなく、AutoMLやLakehouseといった機能を順次追加し、これを組み合わせることで、より魅力的にアプリケーションを開発できるようにしてきた経緯がある。AutoMLは専門知識がなくても機械学習の機能を活用できるようになり、Lakehouseによって、オブジェクトストアに直接クエリをかけることができ、分析も高速化することができた。そこに新たな追加したのがGenAIとなる。

HeatWaveを使用したデータ処理

 HeatWave GenAIは、業界初となるインデータベースLLM(大規模言語モデル)の採用や、自動化されたインデータベースベクトルストア、スケールアウトが可能なベクトル処理、非構造化コンテンツから情報を得た自然言語によるコンテキスト会話機能を備えており、ユーザーは、AIの専門知識や別のベクトルデータベースへのデータ移動をする必要がなく、自社の企業データに生成AIの機能を容易に導入できるのが特徴だ。また、組織のデータに対して迅速なセマンティック検索を実行し、迅速で正確な回答を提供。HeatWaveチャットを通じて、複雑な手動操作を行わずに、自然言語でデータベースから検索ができる。

 「Oracle以外のデータベースを使用して、生成AIアプリケーションを構築しようとすると、複雑なステップを踏む必要がある。ベクトルストアを作成したり、LLMでベクトルストアを使用したりする際にも、複雑な作業が必要になる。これに対して、HeatWave GenAIでは、APIをひとつ呼び出すだけで済む。例えば、ベクトルストアを作成する際には、SQL文で、ドキュメントがどこにあるのかを記述すると、HeatWaveがロードし、セグメント化し、ベクトルストアを生成することができる。内部では複雑なことをしていても、タスクを最適にスケジューリングし、パフォーマンスも高い状態を維持する。ユーザーにとってはブラックボックスといえる状態で複雑な処理が完了する」とした。

HeatWave GenAI:統合、自動化およびセキュア

 ストレージに格納されている文書に変更が加わると、HeatWaveではベクトルストアにおいても自動更新が行われるという特徴も強調した。

 また、ベンチマークでは、HeatWaveによるベクトル処理はSnowflakeと比較して39倍、Databricksと比較して96倍、Google Big Queryと比較して48倍の価格性能比を達成しているという。

 さらに、HeatWaveによるベクトル作成は、Amazon Bedrockのナレッジベースと比較して最大30倍高速となり、コストは4分の1になるほか、SnowflakeやDatabricks、BigQueryと比較した場合、ファイルからの自動テキスト解析、テキストの自動セグメンテーション、自動埋め込み生成、ベクトルストアへの埋め込みやメタデータの自動挿入などの機能を有しているのはHeatWaveであることを強調。「他社の製品では、生成AIと相性がいい機能が備わっていない。HeatWaveだけが、ベクトルストアの作成を自動化できる」と断言した。

HeatWaveはAmazon Bedrockのナレッジベースに比べ、最大30倍高速で、コストは1/4
HeatWaveはベクトルストアの作成を自動化する
インデータベースLLMとインデータベース埋込みの生成

 さらに、インメモリでのスケールアウトが可能であることや、512ノードまでの拡張が可能であり、ほかの述語と組み合わせることが可能なこと、さらに、HeatWaveでの類似性検索が、正確で非常に効率的であることを指摘。「自由記述型の文書と、データベースの構造型クエリを組み合わせることで、膨大な文書のなかからユーザーが求めているものに近い結果を出すことができる。そこには、インデータベースLLMであるメリットも生かされている」などとした。

HeatWaveでの類似性検索は正確で非常に効率的

 インデータベースLLMは、LLaMAなどを活用することができ、外部LLMを選択したり、統合したりといった複雑さを気にすることない。また、クラウドプロバイダーのデータセンターごとのLLMの有無についても心配することなく、生成AIを利用できるとしている。

 「インデータベースLLMによって、HeatWaveのベクトルストアでデータを検索し、コンテンツを生成あるいは要約し、検索拡張生成(RAG)を実行できる。さらに、生成AIをAutoMLなどのHeatWaveのほかの組み込み機能と組み合わせることで、よりリッチなアプリケーションの構築が可能になる。これまでのように、データベースとLLMが別々で提供されていると、APIを介してリモートで呼び出す必要がある。それに対して、インデータベースLLMは、アナリティクスの処理を行っているノードに搭載しており、簡素化ができる。特に、構造化されたデータが大量にあり、RAGを使える環境にあった場合にはHeatWaveはより効果的に利用できる。HeatWaveでは、インデータベースLLMと外部LLMの選択が可能であり、アプリケーションの用途によって選択できるてんも特徴である」とした。

HeatWaveベクトル・ストア:RAGおよびSQL問い合わせ

 さらに、スクリーベン氏が強調したのが、GenAIとAutoMLの統合により、精度を高め、コストを削減できるという点だ。

 デリバリー向けアプリを提供するEatEasyは、HeatWave AutoMLを多用しており、アプリを利用しているユーザーの過去の注文履歴をもとに、レコメンデーションを生成。GenAIを組み合わせることで、自然言語のテキストでユーザーに、推奨する商品の内容や理由を、詳細に伝えることができるようになったという。しかも、AIに関する専門的知識がなくても構築することができ、サードパーティ製品との統合という煩雑さもなかったという。

 チャットボットを提供しているSOCOBOXでは、HeatWaveのAutoMLを利用し、異常なログを検出。それをインデータベースLLMにより、異常なログの内容について、自然言語によるサマリーとして表示できるようにしたという。「文書のセマンティック検索と異常検出に、AutoMLとGenAIを組み合わせたユニークな事例」と位置づけた。

GenAIとAutoMLの統合により、精度を向上させ、コストを削減
パーソナライズされた推奨事項(SOCOBOXの事例)

 また、Oracle以外のサービスでは、データ移動が多かったり、さまざまなセキュリティサービスを組み合わせたりする必要があるのに対して、HeatWaveでは、データをひとつのデータベースシステムに統合でき、統一的なアクセス制御と単一の構成を持ち、すべての通信が認証され、暗号化されるため、セキュリティ面でも強みがあることにも言及した。

HeatWaveによりセキュリティが容易

 「HeatWave GenAIの新機能は、HeatWaveの既存ユーザーは追加費用なしで利用できることも大きな意味を持つ。AI活用におけるコスト削減につながる」とした。

 このほかHeatWave GenAIは、OCIのコマーシャルリージョンでの利用に加えて、専用リージョンであるOCI Dedicated RegionやOracle Alloyを通じた利用ができる。さらに、Amazon Web Services(AWS)およびMicrosoft Azure上でもネイティブに利用できるようにするほか、今後は、Google Cloudでも利用を可能にする計画も明らかにした。

生成AIアプリをどこでも簡単に構築および導入

 スクリーベン氏は、「HeatWaveは、金融、製造、小売など幅広い業界で使用されており、さまざまな地域で活用が進んでいる。高速なデータ分析のニーズは、あらゆるところで存在する。日本では、世界初となるHeatWaveのユーザーグループであるHeatWavejp(MySQL HeatWave Japan User Group)があり、ファンが多い」と述べた。

 また、「HeatWaveは、魅力的なアプリケーション開発を支援する形で進化を遂げてきた。Lakehouseと高速なアナリティクス、AutoMLを組み合わせて使えることは、日本のユーザーにとっても魅力的なものだろう。また、日本語を含む27言語に対応しており、類似性検索などをそれぞれの言語で実行できる。HeatWave GenAIは、AIの専門知識がなくても、高度な生成AIアプリケーションを構築でき、複雑な手作業による統合やトラブルシューティングが不要になる。データを別のサービスに移行する際のセキュリティリスクやコストも必要がない」などと訴えた。