ニュース

日立、多様なデータ活用を容易にする超高速データベースエンジン「HADB」最新版を提供

HADB最新版の利用イメージ

 株式会社日立製作所(以下、日立)は1日、多様なデータの活用を容易にするデータレイクハウス向けに進化した、超高速データベースエンジン「Hitachi Advanced Database(以下、HADB)」の最新版Version 6を提供開始した。また、最新版の提供に合わせて、製品名称を「Hitachi Advanced Data Binder」から「Hitachi Advanced Database」に変更した。

 日立はこれまで、ビッグデータ利活用の促進を目的に、大量のデータの複雑な分析を高速に実行する非順序型実行原理を備えたHADBを、製造・流通・金融・社会・公共など、さまざまな分野のデータウェアハウスに適用してきた。今回、企業のDXをさらに加速させるため、データウェアハウスのみならず外部のデータレイクに対しても、SQLにより柔軟かつ高速なデータ検索が可能なデータレイクハウスを実現するHADBの最新版を提供する。

 最新版では、オブジェクトストレージ上のファイルやオープンテーブルフォーマットに対して、SQLによる直接検索が可能になった。具体的には、Amazon S3などのオブジェクトストレージ上のCSV、JSON、Parquet形式データやApache Icebergテーブルを、データの加工やHADBへの取り込み作業なしで、直接SQLで検索できる。

 また、オブジェクトストレージのデータ読み出し速度をHADB独自の非順序型実行原理による並列処理でカバーし、高速な検索ができる。さらに、検索した結果は、HADBの機能により、オブジェクトストレージ上でParquetファイルとして出力できるため、大規模分析ワークロードや機械学習パイプラインに用いられるデータとして手間なく活用できる。

 これらの特長により、例えば企業が提供したサービスや商品の品質向上などのため、履歴データの追跡・検証や購買データを用いて顧客の傾向分析などを行う際に、データレイクからHADBにその都度データを加工して取り込む作業が不要となる。これにより、データレイク内のデータとHADB内のデータを横断的に検索できるため、過去と現在のデータを掛け合わせるなど、より多角的な観点での分析が容易となり、検証や分析、予測の効率化や高精度化などが図れる。

 あるいは、データレイクに蓄積したデータを生成AIの学習データとして用いる場合には、従来、学習データはあらかじめETLツールなどで構造化データに変換する作業が必要で、大量のデータを素早く準備することが重要となる。HADBは、データレイク上の学習データをそのまま構造化データとして扱い検索できるため、多くの生成AIがそのまま学習可能なParquet形式へ出力できる。そのため、学習前のデータの加工処理が不要となり、与えるデータの量が品質を左右する生成AIの学習効率を向上でき、業務への生成AI適用を促進する。

 オブジェクトストレージ上のデータも高速検索でき、データウェアハウスのデータと横断的な検索ができる。そのため、期ごとや期間別の分析などで用いる利用頻度が低い分析データは保管コストが安価なデータレイク上に格納し、利用頻度が高く、より高速な検索が求められるデータはHADBに格納するといった使い分けができる。これにより、ストレージコストの最適化が図れる。また、利用頻度が低下したデータをデータウェアハウスからデータレイクへ移した場合でも、監査対応や品質保証などの業務で、急遽データが必要になった際、再度データを取り込まずにHADBから直接SQLで検索できるため、必要なデータを迅速に分析に活用できる。

 日立では2025年度中に、オンプレミス環境や拠点ごとのデータレイクに適したAmazon S3互換オブジェクトストレージ「Hitachi Virtual Storage Platform One Object」の提供開始を予定している。これにより、HADBのオンプレミス向けデータレイクソリューションの強化を進めるとともに、データレイク検索のさらなる高度化や今後のAI技術の進化を見据え、ベクトルデータやグラフ構造など、データの意味や属性まで考慮した類似検索技術への対応も行うなどHADBの機能強化を図っていく。これらの取り組みにより、HADBの高速処理能力をさまざまな分野で活用し、企業のDXの加速を支援していくとしている。

 Hitachi Advanced Database Version 6の標準価格は、年額383万4000円(税別)から。