トピック
データを素早く使いこなせ! Oracle Autonomous Database Cloudで誰でもできるアプローチを、3チームのエキスパートが語り競う
- 提供:
- 日本オラクル株式会社
2019年5月30日 15:00
データに基づいた経営により業務の徹底した効率化が求められる中で、扱うデータが増えるほど処理に時間がかかる、データベースの運用やチューニングを請け負うエキスパートの確保に苦労するなど、思うように分析に集中できないという課題がある。
これらの課題解消の切り札と言えるのが、自律型データベースクラウドサービス「Oracle Autonomous Database Cloud」だ。この"自律型"とはどういうことか。データベースの運用がすべて自動化され、データを守るセキュリティパッチの適用やバックアップなどの運用業務だけでなく、性能を向上する高度なチューニングまで機械学習によって自動化されているのだ。またSQL関数を用いてデータベース内の大量データを機械学習で分析できるというのも大きな利点だ。
日本オラクル株式会社は5月14日、このOracle Autonomous Database Cloudによるデータ活用セミナー「データ可視化ツール×自律型DBでデータ分析~Autonomous選手権 第3回」を開催した。今回はOracle Autonomous Database CloudとさまざまなBIツール、Tableau、MotionBoard、Oracle Data Visualizationと連携し分析した発表が行われた。本稿では、その模様をダイジェストでレポートする。
データ活用・分析用に選ぶDWHとは? 「Oracle Autonomous Database Cloud」の価値
Autonomous選手権の開催に先立ち、日本オラクルの高井純子氏がOracle Autonomous Database Cloudについて解説した。
「利用者数やデータ量が膨大になればなるほど、データベースのチューニングや運用、またセキュリティにおける対策など、DBAの業務は逼迫(ひっぱく)します。しかし、Oracle Autonomous Database Cloudではデータベースに機械学習技術が搭載されており、『自動管理』『自動保護』『自動修復』の機能を備え、管理者によるDBチューニングなしで高いパフォーマンスと可用性を実現しています」
「またOracle Autonomous Database Cloudでは機械学習を実行するためのSQLノートブック・インターフェイスが含まれていて、機械学習アルゴリズム(分類、回帰、異常検出、クラスタリング、関連付け、属性の重要性、特徴抽出、時系列など)を直接データベース・サーバー上でSQL関数で簡単に実行できるので、データ転送などの無駄な作業を省いてすぐ利用可能です」
「Oracle Autonomous Database Cloudのサービスの1つ『Oracle Autonomous Data Warehouse Cloud(以下、ADW)』は、さまざまなBIツールに対応しています。本セミナーでは、Tableau、MotionBoard、Oracle Data Visualizationを用いて、データを素早く使いこなす方法を紹介します」(以上、高井氏)。
●Autonomous Data Warehouse対応ツール一覧
ADWとマーケティングデータ活用の相性は抜群!
最初の発表者はイデア・コンサルティング株式会社の矢原荘悟氏だ。テーマは「SQLで簡単に機械学習を実演!マーケティングデータの分析手法をお見せいたします!」である。
矢原氏は冒頭、「データ分析はマーケティング業務に不可欠な存在です」と強調。事実、マーケティングの成否は、「市場分析」「戦略立案」「施策立案/実行」「分析・改善」の各ステップでの分析が鍵を握る。
「対してADWには『相関ルール』『特徴の抽出』『分類』『クラスタリング』などの、マーケティングデータ分析で活用できる機械学習テンプレートが8つも用意されています」と矢原氏は解説。小売店(100円ショップ)の新店舗開店時にマーケターが行う、顧客分析、立地市場調査、品揃え計画を例に、3つの分析作業を実演して見せた。
1つ目は「顧客の把握」だ。この分析ではOracle Analytics Cloudのダッシュボード機能を活用し、マウス操作だけで顧客データとPOSデータを基にABC分析を実施。作成されたパレート図を参考に、主要顧客の年齢層が30~40歳代であることを把握した。
2つ目の「新規出店場所の検討」では、まず、Data Visualization Desktopを用いて店舗の分布と店舗別の売り場面積、坪当たりの売上高を地図上に円グラフとしてマッピング。次いで、国立社会保障・人口問題研究所の地域別の将来推計人口データを取り込み、30~40歳代に絞り込んで突き合わせることで、潜在顧客数が多く、現時点で坪当たりの売上高が多い、すなわち、新規出店による売上向上余地が最も大きな地域が江戸川区であることを確認できた。
3つ目は“ついで買い”の促すための「陳列商品の選定」。実施したのは商品間の売れ行きの関連性をPOSデータから解析するアソシエーション分析だ。その手順はテンプレートを利用したマイニングによるモデル作成、ルールの取得、パターン分析結果のBIツールでの確認と進むが、「ここでのADWの良いところは、内容が異なる作業を一貫してDB上で操作でき、それだけ手間を省ける点です」と矢原氏。最終的に、サッカーボールとタオルのついで買いの頻度が最も高いことを突き止めた。
矢原氏は、「マーケティングで扱うデータは量も種類も増え続けています。また、モデル作成時は一時的にCPUを増やしたいというニーズもあります。対して、分析高度化に向けた機械学習用アルゴリズムも豊富に整備され拡張性に優れるADWは、マーケティングと非常に相性がいいのです」と笑顔で話を締めくくった。
パフォーマンスチューニングのプロが見る、Autonomous DBの実力とは!?
BIツールとして広く用いられているTableauだが、「データが一定量を超えると、DBをパフォーマンスチューニングするためのエンジニアの工数が増大することに悩まされている方も多いはずです」と指摘するのは、日鉄ソリューションズ株式会社の矢木 覚氏だ。長年Oracle Databaseの構築・運用・チューニングを含む技術コンサルティングを行ってきた矢木氏は、その解決策として、Tableauを活用してADWのスケールメリットを得るための方法を実演して見せた。
矢木氏は、最初にTableauとADWとの接続方法について実演。まず、Oracle Instant Clientをダウンロード。ADWからダウンロードしたクレデンシャルファイルを配置しておく。次に、TableauのConnect画面で「Oracle」を選択し、クレデンシャルファイル内の「tnsnames.ora」にあるサービス名を入力、「Request SSL」ボックスをチェックして「Sign In」をクリックするだけで接続が確立する。あとは表示されたテーブルのドラッグ操作で分析を開始できる。
「一度設定すれば、次回からも同一のユーザー名とパスワードで接続できます。無論、Tableauの使い勝手は接続先がADWでも一切変わりはありません」(矢木氏)。
矢木氏はADWが高速である理由を解説する。1つはADWがExadataを基盤としており、「Smart Scan」や「Smart Flash Cache」などのExadata固有の高速化技術が採用されている点にあるという。クラウドではリソース追加により処理能力の向上が可能だが、そこでボトルネックとなるのがストレージI/Oだ。「ADWではExadataの高速化技術により、CPU数に合わせて性能がリニアに向上します。しかも、オンプレミスのようにリソース追加のためにシステムを止める必要もありません」(矢木氏)。
矢木氏は高速化の実演を行った。まずADWのOCPU(物理コア数)を4から12に増やす。するとシステム停止することなくスケールする。その時間わずか30秒。次にADW内の2億件のデータから必要な120件を検索するSQL処理を実行し、約40秒を要したものが10秒にまで短縮される様子を紹介。「数カ月をかけたチューニングと同様の処理速度をこんなに簡単に稼げます。DB技術者の受難時代が到来したのかもしれません」と神妙に語った。
MotionBoard上でSQL関数を実行し機械学習アルゴリズムを実行
データ分析で今後、外すことができないのが、今を把握するためのIoTデータだ。ウイングアーク1st株式会社の大畠幸男氏と高橋慶氏は、「BIツールをAI化させる自律型DB」と題して、同社製BIツールの「MotionBoard」を使ったIoTデータの活用ノウハウを解説した。
MotionBoardは、複数のデータソースを組み合わせた分析環境をノンプログラミングで構築でき、かつ、分析結果を30種類のチャートや地図など、多彩なかたちで確認/提供することが可能なBIツールだ。加えて大畠氏は、ファイアーウォールに穴を空けることなく必要なデータのみの取得/集計を実現した独自の特許技術を挙げ、「さまざまな場所で管理されているIoTデータを収集し、紐づけ、分析し、可視化するまでの機能を一気通貫で用意しています」と、IoTデータ活用におけるMotionBoardの優位性を強調する。
工場にある既存のオンプレミスのシステムをクラウド化するにはハードルがあるため、分析用のDWHをクラウド上で構築しハイブリッドクラウド運用することで、データ活用を簡単に実現できることもMotionBoardの強みである。
MotionBoardの利用例として大畠氏は、気温や降雨量、風速などのセンサーデータを収集している農場のBIダッシュボードを紹介した。ちなみに、その農場は同社自身が保有・運営しているそうだ。そこでは、操作画面のカレンダーをクリックすることで、過去の気象データをグラフ表示で遡って簡単に確認できる。IoTデータの利用ではセンサーデータの収集が一筋縄でいかないことが課題となりがちだが、「MotionBoardであればデータの一元化、さらに他データと紐づけた分析基盤の整備も実現できます。ひいては、他社に一歩先んじた分析も可能になるわけです」(大畠氏)。
こうした機能面の高さもあり、MotionBoardは物流や設備管理だけでなく、養豚場、農場、病院など、多様な場面ですでに広く利用されているのだという。こうしたデータ活用にMotionBoardが使われる中、さらに進んだデータ解析を行うためにADWと連携することによって実現可能となる。
次いで、「私はSQL大好き人間です」と自己紹介した高橋氏は、MotionBoardとADWとの連携における操作方法をデモ形式で解説。前のセッションで紹介されたTableauとほぼ同様の操作でADWへの接続やテーブルの取り込みが可能なこと、また、例えば売上マスタと商品マスタを取り込んだのちに、共通項目である「商品コード」をマウス操作で簡単にリンクさせることでマスタ結合も行えること、さらにADWで活用できる機械学習のテンプレートを利用し、コピー&ペーストでSQLを一切記述することなく分析処理を実施できることを実演して見せた。
「100万件分のデータを使った分析モデルの生成処理も、10秒ほどで完了します。これも、ADWの性能の高さがあればこそ。MotionBoardとADWにより使い勝手と性能を高いレベルで両立させることで、ビジネスの可能性は格段に広がるわけです」(高橋氏)。
分析の新たな切り口として注目される「グラフ」とは!?
3件の発表後、観覧者による投票・集計の間に日本オラクルの太田恭介氏より、近年注目を集めているグラフとグラフデータベースの解説が行われた。
そもそもグラフとは、点と線で表現されるデータの集合体で、その一番の特徴は個々のデータ同士の関係性の分析に優れることだ。グラフデータベースは文字通り、それらのデータの格納・処理に特化したデータベースである。
「グラフではデータ同士の関係性を視覚的に容易に確認できます。つながりを足したり引いたりなども、グラフデータベースであればRDBより格段に容易に行えます」(太田氏)。
太田氏は米国における著名人の関係性を示したグラフ図を提示し、ネットワークを構成する上での重要人物をピックアップするなどデモを紹介。グラフを使うことで、「関係性」に着目した、RDBでは負荷が高い分析を高速かつ容易に行えることもあり、グラフは新たな分析の切り口として注目を集めている。グラフの関連アプリケーションやグラフデータベースの市場規模は今後継続的に拡大すると予想されており、グラフを使った分析技術のニーズもますます高まっていくと予測されている。
その応用分野は幅広く、顧客と商品のつながりを基にしたレコメンデーションや、口コミなどで拡散役となるインフルエンサーの特定、不正取引のパターン把握を通じたセキュリティ対策などへの応用が考えられるという。
こうした中、オラクルでは分析エンジンとしてOracle Labs Parallel Graph AnalytiX(以下、PGX)を開発しており、インメモリデータ処理と並列実行処理によってグラフデータに対する高速な参照、演算処理を支えている。併せて、Oracle Databaseをグラフデータにネイティブ対応するためのOracle Spatial and Graphオプションやグラフデータ用の機械学習アルゴリズムのライブラリも提供しており、「Oracle Databaseではすでにカジュアルにグラフを活用できる環境にあります」と太田氏は自信をのぞかせる。
投票の結果、本コンテストの優勝者にはウイングアーク1stが選出された。受賞コメントを求められた大畠氏は、「ADWの圧倒的なパフォーマンス、スケーラビリティ、さらに機械学習を容易にできることで今後のデータ活用の敷居が低くなり、勘や経験頼りだった技術を世の中の課題解決につながる。MotionBoardと組み合わせることによって企業様のデータ活用のご支援をしていきたい」と抱負を述べ、高橋氏は「RやPythonを触ったことのないエンジニア、特にDBAにとって、身近なSQLで機械学習が行えるOracle Autonomous Database Cloudの意義は決して小さくありません。皆さんもまずは試して、その可能性を感じてください」と訴えた。
セミナーの最後に高井氏は、「本セミナーでご紹介したOracle Autonomous Database Cloudを含め、Oracle Cloudは皆様のデジタルトランスフォーメーションに役立つプラットフォームをご提供しています。Oracle Cloudを活用したビジネスデザインをともに作り上げていく企業様とのアライアンスを今後より一層強化していきたい」と締めくくった。
以上、Autonomous選手権の模様をレポートしたが、今後どのようなデータ活用のアイデアが生まれることになるのか。第4回のコンテストも要注目だ。