ニュース

富士通研、人やモノのつながりを表すグラフ構造のデータから新たな知見を導く「Deep Tensor」技術を開発

 株式会社富士通研究所は20日、人やモノのつながりを表現できるグラフ構造のデータから新たな知見を導く機械学習技術「Deep Tensor(ディープ テンソル)」を開発したと発表した。

 データの特徴要素を自動的に抽出できるDeep Learning技術は、画像や音声の認識などで注目されているが、グラフ構造のデータは構造が複雑で、大きさや表現方法など多様なデータが混在しているため、従来はDeep Learning技術を適用することが困難だったという。しかし今回、富士通研究所では、人やモノのつながりを表す多様なグラフ構造のデータを高精度に学習できるDeep Learning技術を開発した。

 まず、グラフ構造のデータを統一的表現に変換する、最先端のデータマイニング技術である「テンソル分解」技術を開発している。テンソルとはベクトルや行列を拡張した数学表現で、グラフ構造のデータをテンソルを用いて表現した上で、テンソル分解によって統一的な表現形式に変換する。

新技術によるグラフ構造データの分類

 続いて、ニューラルネットワークの学習過程で通常用いられている誤差逆伝搬法の適用範囲をテンソル表現まで拡張し、分類精度を最大化するように、統一的表現も同時に最適化する。具体的には、基準となるパターンを変化させたときのニューラルネットワークの分類誤差の変動の大きさから、テンソル表現の基準パターンを更新するとのこと。

ニューラルネットワークの学習と統一的表現の最適化

 こうした技術を適用すると、コンピュータやIoT機器などの通信ログや、金融取引、化学組成など、グラフ構造で表現できるデータを活用した新たな分析を行えるようになる。

 例えば、化合物の構造と活性のオープンなデータベース「PubChem BioAssay」のデータに適用し、コンピュータ上で医薬品の候補化合物を探索するバーチャルスクリーニングに適用した実験では、機械学習技術の1つであるサポートベクターマシンを用いた従来技術の約100倍となる、数十万種規模の化合物の構造と活性の関係を学習できたとのこと。

 こうして、既存技術ではとらえられていなかった特徴が抽出されたことで、既存技術に比べ約10%向上となる、約80%の活性予測精度を達成。医薬品開発において課題となっている、開発期間やコストの削減が期待されるとした。

 一方、侵入検知のベンチマークデータに適用したところ、ホスト間の通信関係を表すグラフ構造のデータから不正や攻撃の検知を行う実験では、サポートベクターマシンを用いた既存手法に比べ、2割以上の誤検知の削減に成功。ネットワーク監視業務の効率化が期待できる。

 なお富士通研究所は今後、グラフ構造データの分類技術のさらなる高精度化を進め、AI技術「Zinrai」のコア技術として2017年度上期中の実用化を目指す。

グラフ構造で表現できるデータとテンソル表現