ニュース

NEC、熟練者の意図を学習し、意思決定を模倣するAI技術を開発

 日本電気株式会社(以下、NEC)は17日、熟練者の過去の行動履歴データから、その認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルが要求される業務を大幅に効率化するAI技術を開発したと発表した。この技術を、属人的な業務の意思決定プロセスに適用することにより、業務負荷を大幅に軽減することができ、業務スピードの大幅な向上が可能となるとしている。

 開発した技術は、報酬を基に最適行動を導きだす強化学習に対して、最適行動から報酬を推定する「逆強化学習」のフレームワークをNEC独自のアルゴリズムで拡張し、従来、技術者が行っていた意思決定モデルの構築を自動化。人手では定式化が困難な意思決定問題に対して、熟練者の過去の行動履歴データから意思決定モデルを作成することで、熟練者と同等の判断を迅速かつ自律的に導き出す。

 従来の逆強化学習では、熟練者の一連の行動を単一の意思決定モデルとして学習するため、状況に応じた複雑なモデルを構築することは困難だったが、今回の技術では、NECの最先端AI技術群「NEC the WISE」の1つである異種混合学習を拡張して、行動履歴データから複数の意思決定モデルとそれらの切り替えルールを学習する。

 これにより、熟練者が時と場合より柔軟に使い分ける判断基準を、非熟練者でも理解しやすいロジックで説明でき、熟練者と同等レベルの意思決定を行えると説明。たとえば、営業販売に適用した場合、成約率の高い営業の行動履歴を学習し、顧客(見込み客、常連客など)ごとに異なる最適な対処を学習し、経験の浅い営業に活動指針を出すことが可能になる。

 また、熟練者の過去の行動履歴から、意思決定モデルだけでなく制約も同時に学習する。熟練者と同等レベルの意思決定をするためには、大きなリスクを避け、効果を最大化にする施策を選択する必要があるが、開発した技術では、熟練者が選択しない行動はリスクがあるため避ける制約、常に行っている行動は守るべき制約と見なし、熟練者が考慮し最適化しているモデルと組み合わせて同時に学習する。意思決定モデルと制約を同時に学習することで、熟練者が無意識に行っている安全で信頼性の高い判断と同等の意思決定が可能となる。

 また、熟練者・非熟練者の行動履歴データからのサンプリングにより意思決定モデルを評価できるモデルフリー方式を新たに開発。同方式を採用することで、コストのかかる精緻な状態遷移モデルの準備が不要となり、学習環境を大幅に簡略化することが可能になり、学習途中の意思決定モデル評価をシミュレーターなどで実行する必要もないため、学習を既存逆強化学習の100倍の効率で実現できるとしている。

 今回開発した技術を、TV放送局の広告スケジューリング業務に適用し、実データを使った性能評価では、経験豊富な熟練者と同等レベルの意思決定を10倍以上のスピードで実現できることを確認したという。

 NECでは、今回開発した技術は、RPAを適用できない複雑な意思決定を必要とする営業活動やプラント運転などの業務領域や、人の判断・動作を物理的に再現する自動運転やロボット制御などの領域に適用できると説明。今後は、熟練者への負荷が高い様々な業務への適用を進め、人のパートナーとなりうるAIの開発に取り組むとしている。