ニュース

dotData、データサイエンス自動化プラットフォーム「dotData Enterprise」のデータ透明性強化などを行った最新版を提供

 米dotDataは1日、データサイエンス自動化プラットフォームの最新版となる「dotData Enterpriseバージョン 2.12」をリリースした。日本国内では3月末に提供開始予定。

 新バージョンでは、データの透明性を強化。dotData Enterpriseにインポートされた複雑で大規模なデータを、統計的サマリーと詳細レコードレベルで高度に可視化する機能を追加した。この新しい可視化機能により、ユーザーは探索的データ分析を行い、データのパターンと品質をより深く理解した上で、特徴量の設計や機械学習モデルの構築を実行できる。

 また、新たに追加したモデル推薦エンジンにより、モデルの精度、安定性、複雑性、解釈可能性のバランスを調整し、ユーザーの好みに応じた最適なモデルを提案する。dotDataのユーザーは、モデルを選ぶ際に、多数の統計的指標を分析し比較する必要はなく、ガイダンスに従うことで、ニーズに従ったモデルを選べる。

 時系列モデリングでは、製造業やセンサー分析でよく利用されるウェーブレット変換に基づく特徴量、需要予測でよく使用されるイベント特徴量、解約予測に必要な時間間隔特徴量など、さまざまな時系列特徴量を追加した。また、時系列予測を大きく安定させるための時系列の局所的な外れ値の自動除去や、複数表からなるデータのリーク特徴量を防止するための機能強化が導入された。

 特徴量の解釈性強化も実施し、特徴量を単なる機械学習の入力だけではなく、ビジネスに役立つ洞察としての解釈を加速するため、特徴量の最も重要な区間をセグメントとして導きだせるようになる。これにより、ユーザーはビジネスにとってより有意で重要な特徴量を発見し、より迅速にビジネス課題に対して実行可能な洞察を得られる。

 Microsoft Azureとの連携では、dotData PyとAzure Synapse Analyticsとの連携に続き、Azure Synapse Analyticsとのデータ連携、Azure Active Directoryによる高度なユーザー管理など、連携を強化。AzureユーザーがdotDataのデータサイエンスオートメーションをよりシームレスに体験できるようになる。