ニュース

日立、AIを活用してデータ分析の準備作業を効率化する「Data Preparation Service」を提供

 株式会社日立製作所(以下、日立)は2日、データの分析や利活用を行うための準備作業である「データ前処理」をAIで効率化するサービス「Data Preparation Service」の提供を開始した。価格は個別見積もり。

 Data Preparation Serviceは、社内外から収集した多種多様なデータを解析して、仕様や傾向を把握するデータの理解から、クレンジングなどの加工方法の検討・検証、実際の前処理の実行まで、従来は人手で膨大な工数を要していたデータの整形・加工作業を高度化する。

 具体的には、顧客やプロジェクトごとにサービス専用の環境を用意し、投入されたデータの項目名や欠損値、データ間の関連性などを提案する機能や、データサイエンティストなどの熟練者が有するデータ加工方法のノウハウを登録・共有できる機能などを提供する。

 データの仕様や品質をAIで解析し、項目名や外れ値の推定などデータの「理解」を支援する機能としては、速度や緯度経度といったデータの指し示す名称をAIで推測する「データ項目名推定」機能や、データの特徴や傾向をAIが解析し、不要なデータや形式の統一・変換が必要なデータなどをグラフで可視化する「データプロファイル」機能、データ統合の検討に必要となるデータ間の関連性を各データの特徴量から自動で判断し提案する「データ間関連性分析」機能を提供する。

 これにより、データの仕様や傾向を容易かつ高精度に把握することを可能とし、業務有識者や各データ提供元へのヒアリング、仕様書の確認、品質調査などデータの「理解」に関わる業務負荷を軽減する。

 データ加工方法の共有やコーディングレスの画面操作により、ロジック検証を効率化する機能としては、クレンジングや統合に関するデータの加工方法を共有できる「前処理ロジック共有」機能を提供。あらかじめ登録された標準的なロジックに加え、よく使われる汎用的なロジックや熟練者の専門ロジックをチームやプロジェクト内で効率的に共有できるため、前処理のためのロジック検討・検証の作業効率化とスキル向上に寄与する。

 また、データ仕様の理解からロジックの検証までの一連の作業は、直感的でグラフィカルな画面設計により容易に実行できるため、ロジック検証の都度、人手を要していたコーディング作業が不要となる。

 さらに、検証した前処理ロジックを、任意のETLツールに連携する「前処理ロジックエクスポート」機能により、個別にロジックを実装する手間なく、さまざまな機器やシステムから発生するデータの前処理を効率的に定常運用へ移行することが可能。検証したロジックを直接ETLツールに連携できることから、データ理解から前処理ロジックの検証、実運用までをシームレスにつなぎ、顧客のデータ利活用を促進する。