ニュース

dotData、データ分析プラットフォームの新版「dotData Feature Factory 1.4」「dotData Ops 1.5」を発表

 米dotDataは20日、データ分析プラットフォーム「dotData Feature Factory 1.4」および「dotData Ops 1.5」の製品アップデートを発表した。今回のアップデートでは、データの品質強化、出力の解釈可能性向上、モデル再学習などの重要な機能強化を実施し、より信頼性の高いAIをこれまで以上に短時間で構築・展開できるとしている。

 dotData Feature Factory 1.4では、Microsoft Fabric上にdotData Feature Factoryを直接デプロイできるようになった。Microsoft Azureユーザーは、Microsoft Fabric上のデータを移動・複製することなく、高品質な特徴量を自動生成できる。Microsoft Fabricで一元化されたデータガバナンスのもと、スケーラビリティ、セキュリティ、柔軟性を備えたdotData Feature Factoryの運用が可能となる。

 また、AIによるデータチェック・クレンジングを強化した。定数カラム、数値フィールドに混在するカテゴリコード、想定フォーマット外の値など、幅広いデータ品質の問題をAIが自動検出する。検出結果に対しては修正コードを提案し、UIから即座に適用して、データの潜在的な問題を事前に解決する。煩雑で難易度の高いデータクレンジングを、AIが支援する対話型プロセスに置き換え、分析の信頼性を高める。

 さらに、特徴量リーダーボードなどのウィジェットを、スタンドアロンのHTMLとしてエクスポート可能になった。特徴量や分析結果を、分析環境へのアクセスがない業務部門と素早く共有し、静的な報告書ではなく、対話的に結果をレビューし解釈できるようになる。これにより、業務観点でのフィードバックループを素早く回し、価値の高いパターンの発見を加速する。

 dotData Ops 1.5では、デプロイ済みの「チャンピオン」モデルと新しい「チャレンジャー」モデルを比較・管理できるフレームワークを搭載した。チャレンジャーは既存モデルのアップロードに加え、最新データを用いたAutoML(機械学習自動化)による自動再学習タスクから生成できる。常に最適なモデル候補を自動探索し、精度劣化への対処を効率化する。

 シャドウテストと本番モデルの自動切り替えにも対応する。本番で稼働するチャンピオンモデルと並行してチャレンジャーモデルを実行し、本番環境に影響を与えずに、予測精度や特徴量のドリフトを比較・モニタリングする。例えば「直近4回中3回でチャレンジャーがチャンピオンを上回る」など、本番モデルの自動切り替え基準を設定すれば、条件を満たした時点で本番に自動採用され、常に最適なモデルで予測を提供できる。

 このほか、dotData Feature Factory 1.4とdotData Ops 1.5には、機械学習モデルのライフサイクル全体を管理するための堅牢性、使いやすさ、自動化に関するさまざまな改善が含まれる。