CTC、Hadoopの検証施設「Big Data Processing Lab」を開設~PoCサービスなどを提供
ビッグデータ活用に向けたCTCの取り組み |
ITエンジニアリング室の金子直裕室長代行 |
伊藤忠テクノソリューションズ株式会社(以下、CTC)は16日、高速・大容量のデータ処理の検証を目的とした施設「Big Data Processing Lab(BPL)」を開設すると発表した。CTCが推し進める“ビッグデータ”ビジネスの一環で、CTCの総合検証センターである「テクニカルソリューションセンター」(東京・千代田区)内に設置され、Hadoopに関連したPoC(実証試験)サービスなどを顧客へ提供する。
CTCでは現在、ビッグデータビジネスを推進するために、社内横断のタスクフォースを設置してビッグデータの活用法の検討を行うほか、ビッグデータ分析を担う人材「データ・サイエンティスト」育成などの取り組みを行っているが、今回の「BPL」設置もその一環。注目が集まるオープンソースの分散処理ソフトHadoopに焦点を当て、検証ラボを用意した。
設備としては、「テクニカルソリューションセンター」内にスレーブノード10台、ストレージ容量80TBの環境を設置。必要に応じて同センター内の環境と接続し、大規模な検証も行えるようにしているという。またHadoopディストリビューションとしては、米Clouderaの「Cloudera's Distribution including Apache Hadoop(CDH)」のコミュニティ版を利用する。
具体的なサービスとしては、HadoopのPoCサービスの提供を予定しており、問題点のヒアリングから、PoCの項目策定、実際のパフォーマンス検証までをBPLで提供するとのこと。CTC ITエンジニアリング室の金子直裕室長代行は、「当社では3年前から、高速化に焦点を当てたパフォーマンスラボを用意しており、今回はここにHadoopが追加された形。従って、ビッグデータを対象とした高速処理を考える時には、Hadoopだけでなく、ほかのシステムとも比較検証できる点が強みになるだろう」と話す。
Big Data Processing Labの環境 | PoCサービス |
また今後は、CDHの商用版や、EMCジャパンのHadoopプラットフォーム「Greenplum MR」(旧名称:Greenplum HD)などにも対応していくほか、Hadoop対応アプライアンスの検証なども行う予定。また、構造化データだけでなく、非構造化データについても扱えるようにするという。
金子室長代行は、「お客さまからのビッグデータへの期待は高くなっているが、今現在の相談は、すでに動いているデータの(処理)スピードが間に合わないので、データベースで回している中で一部分だけでもスピードを速くしたいといった、直近の課題の相談が多い。またバッチ処理に使いたいという声も多く、近日中に対応する。まずはSQLベースのバッチ高速化について検証環境を提供していきたい」とした。
今後のロードマップ | Big Data Processing Labに設置されたサーバー |