ニュース

富士通研究所、大規模データから機械学習により数時間で予測モデルを生成する技術を開発

 株式会社富士通研究所は7日、5000万件を超える大規模データから機械学習により数時間で高精度な予測モデルを生成する技術を開発したと発表した。

 従来、精度の高い予測モデルを生成するためには学習アルゴリズムや動作条件などすべての組み合わせを調べる必要があり、たとえば5000万件規模のデータによる学習では1週間以上の時間を要していた。

開発技術概要

 富士通研究所では、少量のサンプルデータと過去の予測モデルの精度から機械学習結果を推定し、最も精度の高い結果の得られる学習アルゴリズムや動作条件の組み合わせを抽出して、大規模データの学習に適用する技術を開発。OSSの並列実行基盤ソフトウェアであるApache Spark上で試作した。

 技術としては、機械学習の実行時間と予測精度を推定する技術と、機械学習アルゴリズムを自動的にチューニングする制御技術を開発。分析者のノウハウに依存せず、短時間で高制度な機械学習を選択できるようになった。これにより、5000万件規模のデータであっても、数時間で精度の高い予測モデルが得られるとしている。

機械学習アルゴリズムを自動的にチューニングする制御技術

 富士通研究所では、今回の技術を用いた予測モデルにより、大規模ECサイト会員の退会抑制や、設備の故障対応の迅速化といった改善をタイムリーに実現できると説明。ビッグデータを活用する富士通Analyticsソリューションなどでの実証実験を通じ、2015年度中の実用化を目指すとしている。また、技術の詳細については、9月14日から愛媛大学で開催される研究会「電子情報通信学会 情報論的学習理論と機械学習研究会(IBISML)」で発表を行う。

三柳 英樹