ニュース

予測分析の自動化ツール「SAP InfiniteInsight 7.0」、分析モデル精度を向上

井口和弘氏

 SAPジャパン株式会社は25日、予測分析ソリューション最新版「SAP InfiniteInsight 7.0」を発売した。

 SAP InfiniteInsightは、予測分析を行うためのデータ加工、変数作成、モデル構築、分析作業を容易にするツール。いわばデータマイニングを自動化するもので、手動設定をほとんど不要にし、データサイエンティスト不在でも予測分析を可能にする。

 「従来の予測分析では、サンプリング、データ加工、変数の選択といったデータ準備作業を行った後、さまざまな変数でモデル構築・検証を繰り返す。これら一連の手作業を自動化し、即座にアウトプットしてくれる」(Analytics&Mobilityソリューションズの井口和弘氏)。

従来のデータマイニングとの手順比較

 具体的には、GUIデータ加工ツールにより容易にデータや変数が生成できるほか、機械学習による「モデル自動作成機能」が特徴となる。予測分析においては、さまざまな変数を組み合わせて分析モデルを構築する。このとき、変数の数が多いほど「モデル精度(KI)」が高くなる一方で、結果にぶれが生じて「モデル頑健性(KR)」は下がる。本来は構築したモデルについて手作業で検証を繰り返し、KI/KRのバランスが取れたベストモデルを模索するのだが、「SAP InfiniteInsightのモデル自動作成機能では、その検証も自動化し、ベストモデルを作ってくれる」(井口氏)。

データ加工プロセスの効率化
モデルの自動作成機能(機械学習)

 特徴としてはこのほか、作成したモデルからC/Java/SQLなどのコードを生成し、システムへの組み込みが可能。組み込むことで、業務アプリでシームレスかつリアルタイムに分析が行える。SAP自身、不正検知などのビッグデータ関連ソリューションに機械学習エンジンを順次組み込んでいるところで、さまざまな分野でより意識せずに予測分析が行える環境を整えている。

 今回の新版では、データベースとして、Hadoop Hive 11/12、GreenPlum 4.2を新たにサポート。モデルからそれぞれのSQLを作成可能とした。

 予測モデル精度も向上させるため、複数の変数を組み合わせて新しい変数を作成する「合成変数の作成」、頻度が低いカテゴリをグループ化して処理を効率化する「カテゴリを示す変数のグループ化」に対応。前者では、例えば「緯度」「経度」という変数を「位置」に合成するといったことが可能で、後者では、例えば「都市」や「年齢」といった変数で出現頻度の低い変数をグループ化して処理できる。いずれも“精度(KI)”と“頑健性(KR)”がより最適化されるよう調整しているとのこと。併せて、回帰モデルの精度も向上させた。

サポートデータベースの追加
予測モデルの精度向上

 さらに地理情報にも対応した。地図上で一定の範囲を示す「タイル情報」を自動計算し、分析結果に応じてGoogle Earth上に重ね合わせられるほか、特定の範囲・時間間隔におけるアイテム(人など)の数や流れを図示化できるようになった。

地理情報の対応

SAP InfiniteInsightの販売戦略

 販売戦略については、対象業種やパートナーエコシステム、OEMの拡大を目指す。

 「同技術の開発元であるKXENを買収した2013年9月当時は、金融・通信・小売・eビジネスでの導入がほとんどだった。今後は製造・公共・公益などの市場にも訴求する。また、マーケティング用途が主だったが、予防保守、需要予測、不正検知など多彩な利用シーンへと広げていく」。

 エコシステムについては買収当時1社のみだったパートナーが、2014年9月現在で16社に拡大。「今後も鋭意増やしていく」と同時に、OEM戦略を推進し、キャンペーン管理・メール配信・コールセンター・異常検知といった用途にも広げていくとした。

川島 弘之