ニュース
東芝デジタルソリューションズ、時系列データの自動集計機能などを追加したビッグデータ・IoT向けDB「GridDB」新版
2024年1月17日 10:00
東芝デジタルソリューションズ株式会社は16日、ビッグデータやIoTデータの管理に適したデータベース「GridDB」において、新版「GridDB 5.5 Enterprise Edition(EE)」を提供開始すると発表した。
GridDBは、産業や社会を支える多種多様なシステムを構築・運用してきた知見・実績を基に、東芝デジタルソリューションズが開発したスケールアウト型データベース。時系列データ指向、ペタバイト(PB)級の高い処理能力、高い信頼性と柔軟な拡張性といった特徴を持ち、IoTやビッグデータでの利用に適しているという。
こうした膨大なデータを分析するには、必要なデータを効率よく抽出する必要があるが、従来の方式では、利用者のプログラミング技術によってデータの抽出にかかる時間にばらつきがあり、場合によってはプログラミングをやり直す必要があったとのこと。
今回はこれを改善するため、複数のデータの抽出方法を導き出すと、それぞれにかかる時間を予測し、最適な方法でデータを抽出する「SQLコストベース最適化」機能を追加した。これにより、プログラミング技術にかかわらず、データを効率よく抽出できるという。
東芝デジタルソリューションズでは、同機能のユースケースとして、運用開始後に時間とともにIoTデータの量が増加しても、データ抽出プログラムを見直すことなく、高速なデータ抽出を維持する、といった使い方を挙げている。
また今回は、時系列データ自動集計機能も新たに追加された。この機能を利用すると、データ分析時に都度時間をかけて行われていた、一定時間ごとの平均値や最大値、偏差等の集計・計算をETLツールに登録しておくことで、定期的に計算を自動実行できるようになるため、データ分析にかかる手間と時間を削減できるとのこと。なお同機能では、アステリアのASTERIA Warpや、オープンソースのtalendといったETLツールとの連携が可能としている。
東芝デジタルソリューションズでは、日ごとのデータを分析する場合、前日のデータを集計するプログラムを実行して結果が出るまで待つ必要がなくなり、定期的にバックグラウンドで自動集計されたデータを活用できるため、待ち時間を大幅に削減できると、そのメリットを説明した。