ニュース
dotData、特徴量自動設計技術を「Azure Synapse Analytics」上で利用可能に
2022年12月7日 12:05
米dotDataは7日、同社の特徴量自動設計技術が、Microsoftが提供するデータ分析のための統合クラウドネイティブプラットフォーム「Azure Synapse Analytics(以下、Azure Synapse)」上で利用可能になったと発表した。これにより、Azure Synapseユーザーは、従来に比べて100倍以上もの特徴量を、データから迅速かつ自動的に発見・抽出できるようになり、より深いビジネスの洞察を導き出し、より高精度な機械学習モデルを構築できるとしている。
dotDataの特徴量自動設計技術は、数百万もの特徴量パターンの自動探索を可能にすることで、機械学習のワークフローを加速し、データサイエンスやデータエンジニアリング部門による特徴量抽出の内製化や強化を支援する。また、特徴量パターンの発見や機械学習モデル構築のプロセスを、よりアジャイルに回せるようになるため、プロトタイプの構築や新しいユースケースの探索、どのデータセットがモデルに効くのかを見極めたりすることが、これまで以上に迅速に行えるようになるとしている。
dotDataの特徴量自動設計技術が、Azure Synapse上のPythonワークフローでシームレスに動作することで、Azure Synapseユーザーは、リレーショナルデータベースにあるトランザクションデータや時系列データ、位置情報データ、テキストデータなどさまざまなデータから、数百万にも及ぶ特徴量のパターンを自動探索できるようになる。
これにより、データサイエンスチームは、数十億ものレコードを含んで複雑に関連している数十のテーブルから、数時間で機械学習モデルの構築に必要な特徴量テーブルを自動的に作成でき、従来のような仮説と検証を繰り返す面倒な手作業から解放されるとしている。
Azure Synapseに、dotDataの特徴量自動設計技術を統合することで、Azure Synapseユーザーは、dotDataの特徴量自動設計技術の全機能が利用できるとともに、Azure SynapseのSpark Pool上にdotDataのワークロードを動的にプロビジョニングすることで、より迅速な特徴量エンジニアリングを実現。Azureエコシステムとのシームレスな接続ができ、Azure Synapse上でワークフローを完結できるとしている。