ニュース

Treasure DataとNTTデータがHadoopビジネスで提携、オープンソースのFluentd/Embulkのサポート提供へ

 トレジャーデータ株式会社と株式会社NTTデータは21日、Hadoopサポートサービスで連携していくことを発表した。米Treasure Dataが中心となって開発が進められているオープンソースの「Fluentd」「Embulk」のサポートを、NTTデータが同社のHadoopユーザー向けにサービスメニューの一環として提供していく。

 Treasure Data 代表取締役社長の三橋秀行氏は「ここ1、2年、米国のユーザーを中心にFluentdのサポートを強く求められており、昨年から会社として取り組み始めてきたが、今回のNTTデータとの協業により、より幅広いユーザーのニーズに応えられると思っている」と語っており、特にエンタープライズ層への訴求に注力していく。

トレジャーデータ 代表取締役社長の三橋秀行氏

 今回発表されたサポートサービスの名称は「Fluentd/Embulkサポートサービス」で、NTTデータが提供する「Hadoop/Spark構築・運用ソリューション」の一部である「Hadoop/Sparkサポートサービス」の拡張として、21日付で提供が開始されている。

 基本的にメールベースの問い合わせサービスで、1次回答までのSLAが3営業日に設定されている。回答する内容はFluentdおよびEmbulkのインストール、設定方法、ソフトウェア仕様の確認、不具合の解析や回避策の提示など。顧客から問い合わせがあるとまずNTTデータが受け付け、調査と回答を行い、場合によってはTreasure Dataによる解決の支援(ソースコードレベルでの解析に基づく不具合回避策の提示、必要に応じてパッチの作成など)も受ける。

Treasure Dataが開発する2種類のログコレクタをサポートすることで、NTTデータのHadoopユーザーに多様なデータ移行の手段を提供していく

 FluentdとEmbulkはどちらも、Treasure Dataの創業者で現在はチーフソフトウェアアーキテクトを務める古橋貞之氏が開発したオープンソースソフトウェア(OSS)。ログコレクタのFluentdは2011年に開発が開始され、2016年6月現在のバージョンはv0.14.0。「ログをストリームのように扱える」として、大量のログデータを扱うアドテク企業やゲーム企業、大規模クラウドベンダーでの採用が相次いでおり、AWS(Amazon Web Services)、Microsoft Azure、Pinterest、DeNA、LINE、Atlassianなどでの事例が有名だ。またGoogle Cloud Platformでの標準ログコレクタのひとつとしても採用されている。

 一方のEmbulkはバッチ処理などに適したバルク形式のログコレクタで、2015年からオープンソースとして開発されており、こちらもWebサービス企業を中心に採用が進んでいる。

【お詫びと訂正】
初出時、古橋貞之氏のお名前の漢字を誤って記載しておりました。お詫びして訂正いたします。

6月にロゴが変更されたFluentdは「2016年中にバージョン1.0をリリースする予定でいる」(トレジャーデータ関係者)という

 NTTデータ 技術革新統括本部 システム技術本部 方式技術部 課長の下垣徹氏は、今回のトレジャーデータとの提携について、「Hadoop環境へのデータ収集に関する課題を解決するための施策と位置付けており、とくに大量のデータをHadoop環境に転送する際の送達確認やスケーラビリティ、送信中に壊れたレコードへの対応、データフォーマットの多様化といった課題感が、Fluentd/Embulkによりすみやかに解決されるようになることを期待している」と語る。

 これまで“SIのチカラ”で半ば強引に解決してきた部分を、Fluentd/Embulkというツールのサポートにより、その負荷を軽減していく狙いがあるとみられる。また、同社はこれまでも多くの顧客からFluentdやEmbulkのサポートに関する問い合わせを受けてきたが、「依頼されても“当社ではサポートできない”と断るしかなかった」(下垣氏)としており、今回の提携により、顧客のニーズに応えられるようになった意義は大きいようだ。

 「NTTデータは、Hadoopというオープンソースの名前が日本で知られる前からHadoopのサポートを行ってきており、国内でもさまざまな業種で多くの導入事例を手がけてきた。Hadoopコミッタを社内から輩出し、Hadoopコードのパッチを数多く投稿するなど、コミュニティ(Apache Hadoop)への貢献度も高い。Hadoop専業ベンダに頼らずに顧客のHadoopサポートを責任をもってやりきるという姿勢でこれまで取り組んできた。今回の提携により、データ活用を勧める顧客に対し、より安心して便利に使えるシステムを提供できるようにさらに貢献していきたい」(下垣氏)。

NTTデータ 技術革新統括本部 システム技術本部 方式技術部 課長の下垣徹氏
NTTデータのHadoopコミュニティへの貢献度は世界でもトップクラス。「Hadoop専業ベンダーに頼らないサポートを提供できる」(下垣氏)ことが同社の強み

 一方、トレジャーデータにとって今回の協業は、「エンタープライズユーザーへの訴求」「Treasure DataとFluentd/Embulkの関連付け」という2つの側面での効果が期待される。

 トレジャーデータ マーケティングディレクターの堀内健后氏は「アドテク/マーケティング、IoTにつづき、Treasure Dataのビジネスを支える3本目の柱としてエンタープライズ分野を成長させたい」と語る。

 最近では同社のクラウドデータ分析サービス「Treasure DMP」が資生堂に導入された事例が話題になったが、アドテクやマーケティングでの採用事例の増加に比べ、エンタープライズでの普及はそれほど勢いが強くない。金融や製造業などエンタープライズに多くの顧客をもつNTTデータと組むことで、創業時から掲げてきたエンタープライスビジネスの強化を図りたい構えだ。

 また、米国から今回の会見のために来日したTreasure Data マーケティング部門 シニアバイスプレジデント 田村清人氏は「日本で人気が出たFluentdを米国でも普及させたい一心でこれまでマーケティング活動をしてきた。その甲斐あって多くのユーザーにFluentdの名前を知ってもらうことができたが、逆に最近ではFluentdの開発元がTreasure Dataという事実を知らない人も増えてしまった」と語る。

 「我々は技術の会社であり、技術に投資しているということを示し続けなければならない。その上でもFluentd/EmbulkをTreasure Dataの名前で、日本のベンダとともにサポートしていくことは重要」(田村氏)。

トレジャーデータ マーケティングディレクターの堀内健后氏
Treasure Data マーケティング部門 シニアバイスプレジデント 田村清人氏

 NTTデータは今後、Fluentd/Embulkサポートサービスの提供を通じて得られた知見をFluentd/Embulkのオープンソースコミュニッティにフィードバックしていくとしており、Treasure Dataもまたこれらのソフトウェアの機能拡充に努めていくとしている。