トピック

エンジニア以外もAIを使いこなす時代へ、「Dataiku」が実現するデータ統合と生成AI活用

「クラウドWatch Day|AI×データ活用セミナー」レポート

 データ活用や生成AIなどの技術は進化し、情報も使いやすくなってきたが、依然として活用の中心はエンジニアやデータサイエンティストといった専門家に限られている。こうした課題に対し、あらゆるデータを統合し、多様なテクノロジーを誰でも使える環境を提供するのがユニバーサルAIプラットフォーム「Dataiku」だ。2025年3月27日、「クラウドWatch Day|AI×データ活用セミナー」(主催:インプレス、クラウドWatch)に登壇したDataiku Japan株式会社 セールスエンジニアリング部 シニアセールスエンジニアの庄子 楽氏は、専門家以外でもAIを活用できる同社のプラットフォームについて、実例とデモを交えて紹介した。

Dataiku Japan株式会社 セールスエンジニアリング部 シニアセールスエンジニア 庄子楽氏

AI活用の障壁を取り除くために求められる4つの観点

 Dataikuは2013年にフランス・パリで創業された企業、「データ(data)」と「俳句(haiku)」を組み合わせた社名には、「複雑になりがちなデータサイエンスを、俳句のようにシンプルに表現する」という思想が込められている。創業以来、データとAIの民主化を目指し、誰もが使えるプラットフォームを提供し続けている。Dataiku Japan株式会社 セールスエンジニアリング部 シニアセールスエンジニアの庄子 楽氏は「年率50%の成長を達成し、現在700を超える顧客に様々な業種で活用いただいている」と述べ、急成長する同社の現状を紹介した。

 2024年、DataikuはGartnerの2024年の「データサイエンス&機械学習プラットフォームのマジック・クアドラント」において、ビジョンの完全性の軸で最も上位の位置付けと評価された(※1)。これについて庄子氏は、「生成AIへの明確なビジョン、人へのフォーカスとコラボレーション、そして好みのテクノロジーを自由に選べる柔軟性が評価されたと考えている」と説明する。

 この分野の実行能力の軸においては、主要なクラウドハイパースケーラー3社も評価されているが、「Dataikuは彼らと競合するのではなく、連携・協働するパートナーとしてユニークな立ち位置を築いています」と強調した。さらに実際の製品ユーザーによるレビューでも高い評価を得ており、Gartner Peer Insightsでは2025年4月25日時点、733レビュワーの評価より、5点満点中4.8点という高スコアを記録している(※2)。レビューを見ていると、特にユーザビリティの高さが評価されているように感じる。

 DataikuとDatabricksが2024年に共同で行った調査によると、生成AIが急速に発展している現在においても、AIから価値を引き出す際の障壁は依然として解決されていない実態が明らかになった。「データにアクセスできない」「データの質が悪い」「インフラが複雑すぎて使えない」といった課題が挙げられており、特にデータアクセスやデータの質については2023年よりも悪化している傾向が見られた( 図1 )。

図1:組織がデータ・分析・AIから価値を引き出す際の障壁(DataikuとDatabricksによる調査より)

 庄子氏はこの結果について「AIがより使われるようになり、使いたいデータへの要望も高まった結果、そのデータへのアクセスや質が整っていないことが改めて顕著になってきたのではないか」と指摘する。このような基本的な課題が解決されなければ、最先端技術を使える環境があっても活用は停滞し、価値を引き出すことは難しい。

 こうした課題を解決するため、Dataikuは「ユニバーサルAIプラットフォーム」( 図2 )として、4つの観点からの統合を実現している。

図2:誰もが、多様な技術で、どこにあるデータも統一ガバナンスの下で活用できる

 1つ目の「人やチーム」の観点では、コードを書ける人から書けない人まで、多様なスキルレベルのユーザーが同じプラットフォーム上でコラボレーションできる環境を提供している。「例えばPythonを得意とするフルコードユーザーがノートブック上でコードを記載して作ったアセットを、ノーコードユーザーに使っていただくことも可能です」と庄子氏は説明する。

 次の「データ」の観点では、表形式、画像、文書、ベクトルなど、あらゆるデータタイプに対応し、大規模なデータ移行を発生させずに利用可能な環境を実現している。

 3つ目の「ガバナンス」の観点では、AIライフサイクル全体でのガバナンスを可能にしている。「データ準備、機械学習、可視化、生成AIに至るまで別々のツールをまたいでしまうと、一貫したガバナンスはもはや不可能です。Dataikuのカバー範囲が広いがゆえに、統一したガバナンスが行えます」(庄子氏)。

 最後の「テクノロジー」の観点では、多様な技術を取り入れつつ、急速に変化する技術環境にも柔軟に対応できる態勢を整えている。「今日の最良の選択や構成が明日も最良の選択とは限りません。新たな選択肢が登場した際にすぐに試したり切り替えたりできる状態に準備しておくことが望ましい」と庄子氏は述べた。

業界を超えた導入実績と大規模なROIを創出

 Dataikuはすでに多くの企業に導入され、具体的なROI(投資対効果)を創出している。消費財メーカーのユニーリーバでは98%の時間削減を、エネルギー開発企業のシュルンベルジェでは4,500万ドルの価値創出を、スタンダードチャータード銀行では34万ドルのコスト削減を実現するなど、大きな成果が報告されている。

 庄子氏は具体的な事例として、あるグローバル消費財メーカーの取り組みを紹介した。この企業は多数のブランドを展開しており、組織やデータの所在、解析環境が縦割りで分断されているという課題を抱えていた。この状況を打開するため、同社はデータマーケティングハブを立ち上げ、Dataikuを本格的に導入した。その結果、340人を超えるユーザーが8,200件の分析プロジェクトを推進し、2年間で6,000万ポンドにのぼるコスト削減を実現したという( 図3 )。

図3:グローバル消費財メーカーの成功事例

 注目すべきは、340人のユーザーのうち、データサイエンティストはわずか15%(約50人)に過ぎず、残りの85%はビジネス部門に所属するメンバーである点だ。庄子氏は、「コードを書けるハイスキルな方が自分で使うだけでなく、それらのアセットを企業内で広く展開して活用してもらうための仕組みも揃えている。プロジェクトの共有や再利用はもちろん、プラグイン化してほかの方が機能を自由に呼び出せるようにしたり、ダッシュボードやアプリケーション化して業務部門の方々に展開したりすることも可能」と説明した。さらに、「Dataikuは使われ方の幅も広く、予測まで必要としないケースなどで、例えばExcelで様々なデータ加工を行っている部分だけを、Dataikuに置き換えて効率化を図るといった事例も出ている」と述べ、業務部門における幅広い活用を強調した。

デモで見るDataikuの直感的操作と生成AI活用

 講演の後半で庄子氏は、Dataikuの具体的な機能についてデモンストレーションを通じて紹介。Webブラウザで利用可能なインターフェースで、顧客生涯価値を予測する分析プロジェクトを例に、データの準備、機械学習、そして生成AIの活用までをエンドツーエンドで実演した。

 プロジェクトの概要画面には、各種情報やメンバーの編集履歴が表示され、ディスカッションチャットやToDo管理、Wiki機能など、多様な属性の人がコラボレーションすることを念頭においた設計が施されている。

 データ加工の場面では、GUIによる操作に加え、Pythonなどのコードや、生成AIを活用した自然言語での指示による処理など、複数の選択肢があることを示した。特に生成AIでのデータ加工について庄子氏は「クリック操作などGUIで組み上げた処理を、自然言語で指示をして同じように計算できる」と解説した。

 また、顧客レビューの感情分析においては、OpenAIをはじめとする複数のLLM(大規模言語モデル)から選択して活用できる点も紹介。「各社でお使いになれるモデルから選ぶ形になります。多様なLLMがセットされていれば、それらの中から選んで使うことができます」と述べた。

 データの可視化機能では、BIツールのように項目を選択してグラフ化し、ダッシュボードとして作成・共有できる機能も披露。さらに、AutoML機能を用いた機械学習モデルの構築から、結果の解釈、新たなデータへの適用までをシームレスに実行する様子を示した。庄子氏は「データへのアクセスから準備、加工、機械学習モデルの構築、生成AIの活用までのすべてを、Dataikuでは一つのインターフェース上で試行錯誤しながら進められる」と述べた。

 Dataikuでは約1カ月半に一度という高頻度で製品アップデートを実施し、最新の技術が継続的に取り込まれている。2025年2月のリリースではAIエージェント機能が追加され、「2025年は特にエージェントが注目される年になると予測されており、今後も新機能が順次リリースされる予定」と庄子氏は続けた。

 最後に庄子氏は、より多くの人々にDataikuを体験してもらいたいとして、無償で提供している学習コンテンツやコミュニティについて言及し、利用を呼びかけた。

 「Dataiku Academyでは、データサイエンスやDataikuの使い方を無償で学べるコンテンツを提供している。サンプルプロジェクトを公開しているDataiku Galleryもあり、気軽に試すことができる。Data Haikerという名称のコミュニティや、JAPANユーザーグループ、Slack上のグループなどがあり、Dataikuのユーザーでない方も参加可能なので、ぜひアクセスしてほしい」

●お問い合わせ先
Dataiku Japan株式会社
https://www.dataiku.com/ja/

※1 Gartner, Magic Quadrant for Data Science and Machine Learning Platforms. Afraz Jaffri et al., 17 June 2024

※2 Gartner, Peer Insights, Dataiku in Data Science and Machine Learning Platforms, https://www.gartner.com/reviews/market/data-science-and-machine-learning-platforms/vendor/dataiku/product/dataiku
GARTNERは、Gartner, Inc.および/または米国とその他の国におけるその関連会社の商標およびサービスマークであり、MAGIC QUADRANTおよびPEER INSIGHTSは、Gartner, Inc.および/またはその関連会社の登録商標であり、本書では許可を得て使用しています。All rights reserved.
Gartnerは、Gartnerリサーチの発行物に掲載された特定のベンダー、製品またはサービスを推奨するものではありません。また、最高のレーティング又はその他の評価を得たベンダーのみを選択するようにテクノロジーユーザーに助言するものではありません。Gartnerリサーチの発行物は、Gartnerリサーチの見解を表したものであり、事実を表現したものではありません。Gartnerは、明示または黙示を問わず、本リサーチの商品性や特定目的への適合性を含め、一切の責任を負うものではありません。
Gartner Peer Insightsのコンテンツは、個々のエンドユーザー自身の経験による主観的な意見が集約されたものであり、Gartnerまたはその関連会社の見解を表すものではありません。
Gartnerは、Gartner Peer Insightsに掲載された特定のベンダー、製品またはサービスを推奨するものではありません。Gartnerは、商品性または特定目的への適合性の保証を含む、その正確性または完全性について、本コンテンツの内容に関する一切の責任を、明示または黙示を問わず負うものではありません。