ニュース

NEC、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を開発

 日本電気株式会社(以下、NEC)は19日、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング(深層学習)技術を新たに開発したと発表した。

 ディープラーニング技術の活用例としては、製品の外観検査において、人材確保が難しい熟練検査員をカメラによる画像認識で代用するといったケースがあるが、こうした外観検査をディープラーニングで行うには、不良品データを学習する必要がある。しかし、発生頻度の低い不良品は大量に得ることが難しいため、不良品データの収集や不良品を模擬したデータ作成に多大な時間とコストを要しているという。

 こうした問題に対し、従来はデータ拡張と呼ばれる、学習データを意図的に加工・変形させることでデータ量を人工的に増やす手法が用いられていたが、識別精度を高める効果的な学習データの生成までには至っていなかった。さらに、画像では大きさや回転角度など、音声では声の高さや話す速さなどを変えるなど、対象のデータ種類に応じて専門家がデータの増やし方を調整する必要があるため、さまざまな種類のデータに短期間に適用することが困難という課題があった。

 NECが今回開発した技術は、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が失敗しやすい「苦手な学習データ」を集中的に人工生成し、識別精度を高めるもの。ニューラルネットワーク内部の数値に基づいて自動的に学習データを生成するため、多様なデータに対して汎用的かつ効率良く適用でき、専門家による調整を不要にする。

 NECでは、開発した技術を公開データベース(手書き数字認識:MNIST、物体認識:CIFAR-10)において評価し、学習データ量が半分でも従来技術と精度が変わらないことを確認した。これにより、従来、学習データ収集時間やコストの高さが阻害要因となっていた製品の外観検査やインフラ保全など、さまざまなシステムの早期立ち上げを可能にするとしている。