ニュース

dotData、データサイエンス自動化プラットフォーム「dotData Enterprise」「dotDataPy」をバージョンアップ

 米dotDataは6日、データサイエンス自動化プラットフォーム「dotData Enterpriseバージョン1.6」および「dotDataPyバージョン1.2」をリリースした。日本では10月販売開始の予定。

 新バージョンでは、テキストデータの特徴量設計、AutoML(機械学習自動化)におけるディープラーニング機能、より柔軟でセキュアなHadoopデプロイの機能などを強化した。

 テキストデータの特徴量自動設計により、コールセンターに蓄積される顧客からのフィードバック、営業報告書、会議議事録など、企業にとって重要だが分析が難しいテキスト情報を扱えるようになる。従来の「静的」なテキストデータだけでなく、テキストトランザクション、位置情報付テキスト、時間情報付テキストなど、テキストと他の情報を組み合わせることで特に真価を発揮し、従来は得られなかったビジネスの洞察を企業にもたらすとしている。

 また、新バージョンではAutoML機能の一部として、TensorFlowやPyTorchなどの最先端のディープラーニングフレームワークをサポート。これにより、高度なニューラルネットワーク手法を素早く試すことができるようになる。さらに、ブラックボックス化しがちな高度な機械学習モデルの透明性を向上させるために、Permutation Importanceなどの特徴量検証方法が利用可能になった。

 dotData Enterpriseバージョン1.6では、すでに導入済みのHadoop環境にdotDataをデプロイ可能となり、既存のITインフラストラクチャを活用してdotDataを導入することが可能となった。さらに、バージョン1.4でサポートされたKerberos保護に加えて、バージョン1.6では企業データを保護するためのより高度なHadoopセキュリティオプションをサポートする。

 このほか、タスクステータスを可視化し、より詳細な状況をユーザーが把握できるようになる「進行状況の可視化」などの機能強化を行った。