ニュース
基幹系データとビッグデータ間の壁を破る――、統合データ分析基盤「SAP Data Hub」を提供
2017年11月9日 07:00
SAPジャパン株式会社は7日、企業内において、さまざまなデータを活用するためのソリューション「SAP Data Hub」を発表した。
現在の企業には、WebのアクセスログやSNSのデータをはじめとするビッグデータや、エンタープライズデータウェアハウス(DWH)をはじめとする基幹系データなど、さまざまな種類のデータがあふれている。
これを分析に利用しようとしても、例えばビッグデータの“生データ”をすぐに分析には利用できないため、ほかのシステムのデータと組み合わせて加工し、意味のあるデータに整形するといった作業が必要になる。しかし「その過程がしっかり管理され、可視化されていないと、データがどこから来ているのか、加工処理が正しかったのかなど、信頼がおけない状態のままになってしまう」と、SAPジャパン バイスプレジデント プラットフォーム事業本部長の鈴木正敏氏は指摘する。
また、いざ活用しようとなっても、分析のために新しい開発言語の習得などが必要になる場合もあるほか、多くの企業では、ビッグデータと基幹系データが統合された状態にあるとはいえず、一部の専門職が利用するにとどまっているという。
こうしたデータ活用に関する課題を解決するために提供されるのが、今回発表されたSAP Data Hubだ。SAP Data Hubはビッグデータであるか基幹系データであるかを問わず、企業内の多様なデータソースを活用可能。しかも、GUIベースのツールを利用して、ノンプログラミングでデータのワークフローを定義し、各部門の業務ユーザーが活用しやすい形で提供できるようにする。また、引っ張ってきたデータの来歴はきちんと管理されているため、必要な時にその“出自”を確認することも可能になった。
ビッグデータの集計エンジンとしては「SAP Vora」を、DWH側のエンジンとしては「SAP HANA」をそれぞれ採用する。両製品ともにインメモリ型であるため、高速な処理を実現しているほか、標準機能として連携する仕組みを備えており、それぞれが管理するデータに対して透過的なアクセスを可能にしている。
なお、SAP Voraでは単体でHadoopやAmazon S3などのデータソースへ接続できるが、ETLツールのSAP Data Servicesを介することで、さまざまなデータベースなどとの接続にも対応可能になるとのこと。
「基幹系データとビッグデータを切り離すことなく、HANAでビジネスデータを分析しつつ、Voraでビッグデータを解析し、ドリルダウンしていく。高速なインメモリのテクノロジーで基幹系データだけでなくビッグデータまでカバーできているのが当社の強みで、競合にはまだ追いつけないところだ」(鈴木氏)。