ニュース

NEC、少量の収集データで活用可能な機械学習技術を開発

 日本電気株式会社(以下、NEC)は10日、機械学習技術で必要とされる大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発したと発表した。

 NECでは、ディープラーニングを代表とする機械学習技術が大きな効果を発揮し、さまざまな用途で活用されているが、データ収集の初期段階や、データ収集コストが高い環境のように学習データが大量に得られない状況では、従来の技術ではその効果を十分に発揮できなかったと説明。

 こうした課題に対してNECでは、1)専門知識を持つ人のノウハウを取り入れて、学習効率の高いデータを能動的に収集して学習する技術、2)収集したデータをもとに、実世界の事象の複数のシミュレーション結果の類似度に基づいてパラメータの修正を自動で繰り返し、正しいパラメータを推定する技術、3)AIの分析結果に基づく意思決定時に、収集データを学習用と効果評価用に分割した複数パターンで効果を見積もり、少数データの偏りに影響されにくい意思決定を可能にする技術――の3種類の技術を開発。いずれも、学習用のデータ量が十分に得られていない段階からでも、機械学習技術の活用を可能にするものとなる。

各技術の特徴

 1)の技術では、肥料の成分と植物の育成の関係といった、業務や領域での専門知識を持つ人の物事の因果関係に関するノウハウを数値化して活用する。これにより、学習効率の高いデータを能動的に収集して学習を行えるため、より少ない収集データで学習することが可能となり、データ収集コストを下げることができる。

 2)の技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定する。複雑なシミュレーションを行うには多数のシミュレーションパラメータが必要で、実データに合わせて正しくパラメータを調整する必要があるが、実データが少なく、初期パラメータの見当がつかないと、従来の技術では実データに合うようなパラメータを推定できず、正確なシミュレーションが行えないという課題に対応する。

 3)の技術では、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もる。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになる。効率的な資産配分の決定など、データから学習した結果に基づいて人の意思決定を支援することが期待されるが、学習データが少ないと、意思決定による効果を大きめに見積もってしまうという課題に対応する。

 NECでは、今回開発した技術により、機械学習技術が活用できる場面を拡大することが可能になると説明。開発した技術をはじめとするAIやIoTなどのデジタル技術により、顧客との共創を通じた企業・社会のデジタルトランスフォーメーションに貢献していくとしている。また、今回の成果についてについては、スウェーデンのストックホルムで7月10日~15日に開催される、機械学習技術に関する国際会議「ICML2018(International Conference on Machine Learning)」での発表を行う。