ニュース

アシスト、データプレパレーション基盤「Paxata 日本語版」を販売開始

 株式会社アシストは25日、国内総販売代理店を務める米Paxataのデータプレパレーションプラットフォーム「Paxata(パクサタ)」日本語版を同日より販売開始すると発表した。

 Paxataは、データ準備のプロセスを効率化するデータプレパレーションをエンタープライズレベルで実現するプラットフォーム。さまざまな種類、フォーマットのデータソースを追加・格納でき、データのゆらぎを含めた整備・変更、整形、フィルタリング、データ統合、生成データの活用まで、業務に応じてユーザー単位で管理・制限することができる。

 利用したいデータはすべてスプレッドシート上に可視化され、コーディングレスかつポイント&クリックで作業可能なため、データの中身を把握しているユーザー部門での利便性が高まり、IT部門における個々の細かいニーズに応じたデータ準備は不要になるという。

 ただし、目視でデータの中身を精査して精度の高いデータへと加工していく作業は手間と工数がかかるため、Paxataでは、AI技術を活用することで、さまざまな推奨パターンをレコメンドする仕組みを導入している。

 例えば複数のデータセットを結合する場合、データセット内のすべての値を走査し、結合キーの組み合わせをデータのマッチ率とあわせて提示したり、フリーフォーマットで書かれたデータ内容が類似している場合には、類似データをすべて修正候補として提示してくれる。こうした機能により、ユーザーは分析に適したデータを容易かつ迅速に確定させていけるとのこと。

 膨大なデータにさまざま加工を施し、リアルタイムに結果を確認しながらデータセットを作り上げていく一連の処理を最適化するため、Sparkベースのインメモリ分散処理エンジンを採用しているほか、データセットを格納するストレージには、スキーマレスなデータ管理が可能なHDFSを利用している。

 なお、Paxataで加工したデータをETL/EAIツールと連携させ、全社で再利用可能にすることで、データ活用の拡大を図るとした。

 ライセンスは、データ加工・変換処理を実施する「Pipeline Worker Servers」のコア数合計に対して課金する仕組みとなり、価格は、使用権+サポートの年間サブスクリプション(16コア)で960万円(税別)。追加1コアは60万円(税別)となる。アシストでは、2017年12月末までに30社への導入を目指す。