トピック

データを素早く使いこなせ! Oracle Autonomous Database Cloudで誰でもできるアプローチを、3チームのエキスパートが語り競う

 データに基づいた経営により業務の徹底した効率化が求められる中で、扱うデータが増えるほど処理に時間がかかる、データベースの運用やチューニングを請け負うエキスパートの確保に苦労するなど、思うように分析に集中できないという課題がある。

 これらの課題解消の切り札と言えるのが、自律型データベースクラウドサービス「Oracle Autonomous Database Cloud」だ。この"自律型"とはどういうことか。データベースの運用がすべて自動化され、データを守るセキュリティパッチの適用やバックアップなどの運用業務だけでなく、性能を向上する高度なチューニングまで機械学習によって自動化されているのだ。またSQL関数を用いてデータベース内の大量データを機械学習で分析できるというのも大きな利点だ。

 日本オラクル株式会社は5月14日、このOracle Autonomous Database Cloudによるデータ活用セミナー「データ可視化ツール×自律型DBでデータ分析~Autonomous選手権 第3回」を開催した。今回はOracle Autonomous Database CloudとさまざまなBIツール、Tableau、MotionBoard、Oracle Data Visualizationと連携し分析した発表が行われた。本稿では、その模様をダイジェストでレポートする。

データ活用・分析用に選ぶDWHとは? 「Oracle Autonomous Database Cloud」の価値

日本オラクル株式会社 アライアンス統括 Innovation Alliance推進本部 Cloud Native推進部 担当マネージャー 高井純子氏

 Autonomous選手権の開催に先立ち、日本オラクルの高井純子氏がOracle Autonomous Database Cloudについて解説した。

 「利用者数やデータ量が膨大になればなるほど、データベースのチューニングや運用、またセキュリティにおける対策など、DBAの業務は逼迫(ひっぱく)します。しかし、Oracle Autonomous Database Cloudではデータベースに機械学習技術が搭載されており、『自動管理』『自動保護』『自動修復』の機能を備え、管理者によるDBチューニングなしで高いパフォーマンスと可用性を実現しています」

 「またOracle Autonomous Database Cloudでは機械学習を実行するためのSQLノートブック・インターフェイスが含まれていて、機械学習アルゴリズム(分類、回帰、異常検出、クラスタリング、関連付け、属性の重要性、特徴抽出、時系列など)を直接データベース・サーバー上でSQL関数で簡単に実行できるので、データ転送などの無駄な作業を省いてすぐ利用可能です」

 「Oracle Autonomous Database Cloudのサービスの1つ『Oracle Autonomous Data Warehouse Cloud(以下、ADW)』は、さまざまなBIツールに対応しています。本セミナーでは、Tableau、MotionBoard、Oracle Data Visualizationを用いて、データを素早く使いこなす方法を紹介します」(以上、高井氏)。

●Autonomous Data Warehouse対応ツール一覧

https://cloud.oracle.com/en_US/datawarehouse/tools

Oracle Autonomous Database CloudがDBAの作業を各種自動化

ADWとマーケティングデータ活用の相性は抜群!

イデア・コンサルティング株式会社 クラウド営業部 営業技術グループ グループ長 矢原荘悟氏

 最初の発表者はイデア・コンサルティング株式会社の矢原荘悟氏だ。テーマは「SQLで簡単に機械学習を実演!マーケティングデータの分析手法をお見せいたします!」である。

 矢原氏は冒頭、「データ分析はマーケティング業務に不可欠な存在です」と強調。事実、マーケティングの成否は、「市場分析」「戦略立案」「施策立案/実行」「分析・改善」の各ステップでの分析が鍵を握る。

 「対してADWには『相関ルール』『特徴の抽出』『分類』『クラスタリング』などの、マーケティングデータ分析で活用できる機械学習テンプレートが8つも用意されています」と矢原氏は解説。小売店(100円ショップ)の新店舗開店時にマーケターが行う、顧客分析、立地市場調査、品揃え計画を例に、3つの分析作業を実演して見せた。

 1つ目は「顧客の把握」だ。この分析ではOracle Analytics Cloudのダッシュボード機能を活用し、マウス操作だけで顧客データとPOSデータを基にABC分析を実施。作成されたパレート図を参考に、主要顧客の年齢層が30~40歳代であることを把握した。

ABC分析による重点顧客および売れ筋商品の分析。30~40代が主な顧客層であることがわかる

 2つ目の「新規出店場所の検討」では、まず、Data Visualization Desktopを用いて店舗の分布と店舗別の売り場面積、坪当たりの売上高を地図上に円グラフとしてマッピング。次いで、国立社会保障・人口問題研究所の地域別の将来推計人口データを取り込み、30~40歳代に絞り込んで突き合わせることで、潜在顧客数が多く、現時点で坪当たりの売上高が多い、すなわち、新規出店による売上向上余地が最も大きな地域が江戸川区であることを確認できた。

マップマーケティングによる出店候補地の分析の様子。全人口では江戸川区は4番目だが、顧客層を加味してフィルターを掛けると1番目になる

 3つ目は“ついで買い”の促すための「陳列商品の選定」。実施したのは商品間の売れ行きの関連性をPOSデータから解析するアソシエーション分析だ。その手順はテンプレートを利用したマイニングによるモデル作成、ルールの取得、パターン分析結果のBIツールでの確認と進むが、「ここでのADWの良いところは、内容が異なる作業を一貫してDB上で操作でき、それだけ手間を省ける点です」と矢原氏。最終的に、サッカーボールとタオルのついで買いの頻度が最も高いことを突き止めた。

ADWで活用できるOracle Machine Learning(OML)でアソシエーション分析を行うためのスクリプト。OMLではSQL関数でモデル作成、ルール抽出を行うことができる

 矢原氏は、「マーケティングで扱うデータは量も種類も増え続けています。また、モデル作成時は一時的にCPUを増やしたいというニーズもあります。対して、分析高度化に向けた機械学習用アルゴリズムも豊富に整備され拡張性に優れるADWは、マーケティングと非常に相性がいいのです」と笑顔で話を締めくくった。

パフォーマンスチューニングのプロが見る、Autonomous DBの実力とは!?

日鉄ソリューションズ株式会社 ITインフラソリューション事業本部 クラウドプラットフォーム事業部 オラクル推進部 エキスパート 矢木 覚氏

 BIツールとして広く用いられているTableauだが、「データが一定量を超えると、DBをパフォーマンスチューニングするためのエンジニアの工数が増大することに悩まされている方も多いはずです」と指摘するのは、日鉄ソリューションズ株式会社の矢木 覚氏だ。長年Oracle Databaseの構築・運用・チューニングを含む技術コンサルティングを行ってきた矢木氏は、その解決策として、Tableauを活用してADWのスケールメリットを得るための方法を実演して見せた。

 矢木氏は、最初にTableauとADWとの接続方法について実演。まず、Oracle Instant Clientをダウンロード。ADWからダウンロードしたクレデンシャルファイルを配置しておく。次に、TableauのConnect画面で「Oracle」を選択し、クレデンシャルファイル内の「tnsnames.ora」にあるサービス名を入力、「Request SSL」ボックスをチェックして「Sign In」をクリックするだけで接続が確立する。あとは表示されたテーブルのドラッグ操作で分析を開始できる。

TableauのConnect画面におけるADWへの接続設定。初期設定を済ませたあとは接続先のADWを意識することなくTableauで分析が行える

 「一度設定すれば、次回からも同一のユーザー名とパスワードで接続できます。無論、Tableauの使い勝手は接続先がADWでも一切変わりはありません」(矢木氏)。

 矢木氏はADWが高速である理由を解説する。1つはADWがExadataを基盤としており、「Smart Scan」や「Smart Flash Cache」などのExadata固有の高速化技術が採用されている点にあるという。クラウドではリソース追加により処理能力の向上が可能だが、そこでボトルネックとなるのがストレージI/Oだ。「ADWではExadataの高速化技術により、CPU数に合わせて性能がリニアに向上します。しかも、オンプレミスのようにリソース追加のためにシステムを止める必要もありません」(矢木氏)。

ADWで享受できるExadataの高速化技術。ADWでストレージI/Oがボトルネックになりにくいのは、DB処理をストレージ側にオフロードする「Smart Scan」や、データを圧縮された状態のまま処理する「Hybrid Columnar Compression」といった機能によって、DBサーバー/ストレージ間を流れるデータ量が大幅に削減されるためだ

 矢木氏は高速化の実演を行った。まずADWのOCPU(物理コア数)を4から12に増やす。するとシステム停止することなくスケールする。その時間わずか30秒。次にADW内の2億件のデータから必要な120件を検索するSQL処理を実行し、約40秒を要したものが10秒にまで短縮される様子を紹介。「数カ月をかけたチューニングと同様の処理速度をこんなに簡単に稼げます。DB技術者の受難時代が到来したのかもしれません」と神妙に語った。

ADWにおけるOCPU数変更時のパフォーマンス比較。デモでは、管理コンソールでOCPU数を4から12に変更し、性能がリニアに向上する様が紹介された。OCPU数の変更が反映されるまでわずか30秒である。加えて、インスタンスの停止・再起動などは一切不要だ

MotionBoard上でSQL関数を実行し機械学習アルゴリズムを実行

ウイングアーク1st株式会社 技術本部 プロダクト戦略室 副室長/エバンジェリスト 大畠幸男氏(左)、技術本部 MotionBoard開発部 製品開発グループ アーキテクト 高橋 慶氏(右)

 データ分析で今後、外すことができないのが、今を把握するためのIoTデータだ。ウイングアーク1st株式会社の大畠幸男氏と高橋慶氏は、「BIツールをAI化させる自律型DB」と題して、同社製BIツールの「MotionBoard」を使ったIoTデータの活用ノウハウを解説した。

 MotionBoardは、複数のデータソースを組み合わせた分析環境をノンプログラミングで構築でき、かつ、分析結果を30種類のチャートや地図など、多彩なかたちで確認/提供することが可能なBIツールだ。加えて大畠氏は、ファイアーウォールに穴を空けることなく必要なデータのみの取得/集計を実現した独自の特許技術を挙げ、「さまざまな場所で管理されているIoTデータを収集し、紐づけ、分析し、可視化するまでの機能を一気通貫で用意しています」と、IoTデータ活用におけるMotionBoardの優位性を強調する。

 工場にある既存のオンプレミスのシステムをクラウド化するにはハードルがあるため、分析用のDWHをクラウド上で構築しハイブリッドクラウド運用することで、データ活用を簡単に実現できることもMotionBoardの強みである。

MotionBoardの最大の特徴の1つが、分散されたデータソースをオンタイムで統合・分析できること。夜間バッチなどでデータを統合しておく必要がないため、リアルタイム性を損なうことなく、IoTデータを組み合わせた分析が行える

 MotionBoardの利用例として大畠氏は、気温や降雨量、風速などのセンサーデータを収集している農場のBIダッシュボードを紹介した。ちなみに、その農場は同社自身が保有・運営しているそうだ。そこでは、操作画面のカレンダーをクリックすることで、過去の気象データをグラフ表示で遡って簡単に確認できる。IoTデータの利用ではセンサーデータの収集が一筋縄でいかないことが課題となりがちだが、「MotionBoardであればデータの一元化、さらに他データと紐づけた分析基盤の整備も実現できます。ひいては、他社に一歩先んじた分析も可能になるわけです」(大畠氏)。

 こうした機能面の高さもあり、MotionBoardは物流や設備管理だけでなく、養豚場、農場、病院など、多様な場面ですでに広く利用されているのだという。こうしたデータ活用にMotionBoardが使われる中、さらに進んだデータ解析を行うためにADWと連携することによって実現可能となる。

ウイングアーク1st株式会社が運営する農場「WingArc WakuWaku Farm」のBIダッシュボード。各種気象データが確認できるほか、散水などをダッシュボードから実行することもできる

 次いで、「私はSQL大好き人間です」と自己紹介した高橋氏は、MotionBoardとADWとの連携における操作方法をデモ形式で解説。前のセッションで紹介されたTableauとほぼ同様の操作でADWへの接続やテーブルの取り込みが可能なこと、また、例えば売上マスタと商品マスタを取り込んだのちに、共通項目である「商品コード」をマウス操作で簡単にリンクさせることでマスタ結合も行えること、さらにADWで活用できる機械学習のテンプレートを利用し、コピー&ペーストでSQLを一切記述することなく分析処理を実施できることを実演して見せた。

 「100万件分のデータを使った分析モデルの生成処理も、10秒ほどで完了します。これも、ADWの性能の高さがあればこそ。MotionBoardとADWにより使い勝手と性能を高いレベルで両立させることで、ビジネスの可能性は格段に広がるわけです」(高橋氏)。

MotionBoard上で売上データから商品間のアソシエーション分析を実行している様子。100万件のデータを対象にパラメータを調整してモデルを再生成する処理を実行しても、ADWの高速性により10秒ほどで分析が終了した

分析の新たな切り口として注目される「グラフ」とは!?

日本オラクル株式会社 クラウド・テクノロジーコンサルティング事業本部 クラウドソリューション部 スタッフコンサルタント 太田恭介氏

 3件の発表後、観覧者による投票・集計の間に日本オラクルの太田恭介氏より、近年注目を集めているグラフとグラフデータベースの解説が行われた。

 そもそもグラフとは、点と線で表現されるデータの集合体で、その一番の特徴は個々のデータ同士の関係性の分析に優れることだ。グラフデータベースは文字通り、それらのデータの格納・処理に特化したデータベースである。

データ間の関係性を点と線で表したものが「グラフ」、グラフデータの格納・処理に特化したものが「グラフデータベース」

 「グラフではデータ同士の関係性を視覚的に容易に確認できます。つながりを足したり引いたりなども、グラフデータベースであればRDBより格段に容易に行えます」(太田氏)。

 太田氏は米国における著名人の関係性を示したグラフ図を提示し、ネットワークを構成する上での重要人物をピックアップするなどデモを紹介。グラフを使うことで、「関係性」に着目した、RDBでは負荷が高い分析を高速かつ容易に行えることもあり、グラフは新たな分析の切り口として注目を集めている。グラフの関連アプリケーションやグラフデータベースの市場規模は今後継続的に拡大すると予想されており、グラフを使った分析技術のニーズもますます高まっていくと予測されている。

 その応用分野は幅広く、顧客と商品のつながりを基にしたレコメンデーションや、口コミなどで拡散役となるインフルエンサーの特定、不正取引のパターン把握を通じたセキュリティ対策などへの応用が考えられるという。

グラフ分析の主な適用分野。現在、力技で実現している分析処理が、グラフデータベースを用いることで、よりスマートかつ容易に行えることが期待できる

 こうした中、オラクルでは分析エンジンとしてOracle Labs Parallel Graph AnalytiX(以下、PGX)を開発しており、インメモリデータ処理と並列実行処理によってグラフデータに対する高速な参照、演算処理を支えている。併せて、Oracle Databaseをグラフデータにネイティブ対応するためのOracle Spatial and Graphオプションやグラフデータ用の機械学習アルゴリズムのライブラリも提供しており、「Oracle Databaseではすでにカジュアルにグラフを活用できる環境にあります」と太田氏は自信をのぞかせる。

グラフ分析に対するオラクルの取り組み。Oracle Databaseをグラフデータ対応にするOracle Spatial and Graphオプション、グラフ分析エンジンのPGX(Oracle Labs Parallel Graph AnalytiX)など、グラフ分析をビジネス活用するための環境をすでに整えている

 投票の結果、本コンテストの優勝者にはウイングアーク1stが選出された。受賞コメントを求められた大畠氏は、「ADWの圧倒的なパフォーマンス、スケーラビリティ、さらに機械学習を容易にできることで今後のデータ活用の敷居が低くなり、勘や経験頼りだった技術を世の中の課題解決につながる。MotionBoardと組み合わせることによって企業様のデータ活用のご支援をしていきたい」と抱負を述べ、高橋氏は「RやPythonを触ったことのないエンジニア、特にDBAにとって、身近なSQLで機械学習が行えるOracle Autonomous Database Cloudの意義は決して小さくありません。皆さんもまずは試して、その可能性を感じてください」と訴えた。

 セミナーの最後に高井氏は、「本セミナーでご紹介したOracle Autonomous Database Cloudを含め、Oracle Cloudは皆様のデジタルトランスフォーメーションに役立つプラットフォームをご提供しています。Oracle Cloudを活用したビジネスデザインをともに作り上げていく企業様とのアライアンスを今後より一層強化していきたい」と締めくくった。

 以上、Autonomous選手権の模様をレポートしたが、今後どのようなデータ活用のアイデアが生まれることになるのか。第4回のコンテストも要注目だ。