ニュース

dotData、特徴量と機械学習の運用自動化プラットフォーム新版「dotData Ops 1.4」を発表、Pythonとの連携を強化

 米dotDataは18日、データ前処理から特徴量生成、予測スコア算出までのパイプライン運用を支援する「dotData Ops」のバージョン1.4を発表した。

 新バージョンでは、SQLで記述されたデータ前処理や特徴量生成を、dotData Opsで運用することが可能になった。これにより、ユーザーはドメイン知識に基づく独自の特徴量と、dotDataのAIが自動で抽出する特徴量の両方を、機械学習パイプラインに組み込める。これらの機能は、dotData Feature Factoryとのシームレスな連携により実現され、より高度な次元でのデータ分析と予測モデルの構築が可能となる。

 また、Pythonで開発された機械学習モデルをサポートする。ユーザーは独自に作成した特徴量と、dotDataの特徴量を組み合わせ、任意のPython機械学習ライブラリを活用してモデルを学習させられる。学習されたモデルはONNX形式に変換され、dotData Ops上で運用可能になる。この機能により、SQLを用いたデータ前処理からPythonベースのモデルまで、ユーザー独自のパイプライン全体をdotData Opsで一元管理できるようになる。

 このほか新バージョンでは、データサイエンティストの生産性向上を目的に、Python SDKが導入された。このSDKを使って、ユーザーはPythonから直接dotData OpsのAPIにアクセスし、データの前処理、特徴量生成、予測までの機械学習ライフサイクルを自動化できる。これにより、ワークフローの効率化と迅速化が図れる。また、ユーザーは数行のコードで、dotData Feature Factoryのデータおよび特徴量パイプラインをdotData Ops上で展開できる。