ニュース

primeNumber、クラウドETL「TROCCO」にデータの重複・欠損を検出する「データ品質チェック」機能を追加

 株式会社primeNumberは25日、クラウドETL(Extract/Transform/Load)ツール「TROCCO」において、データ品質を効率的に管理できる「データ品質チェック」機能を提供開始したと発表した。

 TROCCOは、データの収集・加工・連携を自動で行い、点在するデータをひも付けることによって、より複雑で高度な分析を可能にするSaaS型のETLツール。さまざまなデータの連携・整備・運用を自動化し、迅速にデータ活用環境を整備できる点が特長で、従来はエンジニアが手作業で行っていたデータ統合作業の自動化を実現し、企業のデータ活用を推進するという。

 今回は同ツールにおいて、データの重複や欠損を即座に検出する新機能「データ品質チェック」を提供開始した。

 データマートを用いて分析・加工用に作成したテーブルに対して即座に品質チェックを実施し、データの重複や欠損を自動的に検出できるため、問題を早期に発見することが可能。専門知識は不要で、GUIから簡単に品質チェックのルールを設定できるとした。

 なお、今回は第1弾としてBigQueryに対応しており、今後はSnowflakeなど、ほかのデータウェアハウス(DWH)にも順次対応する予定である。