ニュース

日立、自己競争で学習を行うビジネス向けAI技術を開発

人の実績データに頼らずに最良のアウトカムを追求

 株式会社日立製作所(以下、日立)は25日、複数のAI(人工知能)を相互接続したAI群でビジネスを表現し、AI群同士がコンピュータ上で自己競争を行うことで、人が用意した実績データに頼らずに学習を行うビジネス向けのAI技術を開発したと発表した。同日に行われた記者発表会では、新たなAI技術の開発に至った背景や、AI群が自己競争によって学習する仕組みについて説明した。

 今回、日立が開発したのは、ビジネスの問題に適用可能な、自己競争を活用して学習するAI技術。日立製作所 研究開発グループ 技師長の矢野和男氏は、AI技術のビジネス活用における課題について、「これまでのAI技術は、過去の類似事例のデータが大量にある場合、AIが事例に学んだ改善や的確な判断を行うことでビジネスに活用してきた。しかし、過去の事例データが少ない場合には、AIを活用することはできなかった」と指摘する。

 「囲碁などの対戦ゲームでは、過去のデータがなくても、コンピュータ同士の対戦による自己競争で学習するAI技術の有効性が確認されているが、不確定要素の多いビジネスへの適用方法はわかっていないのが実情だった。そこで今回、ビジネス問題に対しても、人の実績データに頼らずに、自己競争で学習ができるAI技術を新たに開発した」と、新技術の開発背景を述べた。

日立 研究開発グループ 技師長の矢野和男氏

 今回開発したAI技術の概要としては、ビジネスにかかわる各企業を、ディープラーニングを用いたAIエージェントで表し、複数のAIエージェントを相互接続したAI群でビジネスを表現。各AIエージェントは、置かれた状況を考慮して、お互いにモノや情報のやりとりを繰り返すことで、損失低減などの与えられたアウトカムの向上に有効なアクションを学習する。

 日立 研究開発グループ 主任研究員の伊藤潔人氏は、「例えば、サプライチェーンのビジネスモデルでは、小売・卸売・仲卸・工場の4つのAIエージェントを設置。各AIエージェントは、試行・観測・学習を繰り返すことで、それぞれのアウトカム向上に有効なアクションを学習していく。また、学習を行う際には、このAI群をコンピュータ上に複数生成し、同時並行で学習を実行。そして、AI群同士で、全体アウトカムを競わせる自己競争を何千回と繰り返すことで、より良いアウトカムを追求する」と、自己競争による学習の仕組みについて解説した。

日立 研究開発グループ 主任研究員の伊藤潔人氏

 さらに同社では、AI群全体のアウトカムの向上を加速させるために、「エージェント間の学習管理機能」と「AIエージェント進化技術」の2つの技術を開発した。「エージェント間の学習管理機能」は、相互接続された複数のAIエージェントの、それぞれの学習を管理し、各AIエージェントの学習が、相互に悪影響を与えることを防止する機能。各AIエージェントの学習タイミングの制御を担い、学習の初期段階ではひとつのAIエージェントのみに学習させ、徐々に学習するAIエージェントの数を増やしていく。これにより、AIエージェントが同時に学習する時に生じる競合を避け、AIエージェント同士の協調を学習させることができ、その結果、AI群のアウトカムの向上につながるという。

新AI技術の自己競争による学習の仕組み

 「AIエージェント進化技術」は、学習モデルを交叉(こうさ)させることでより優れたモデルを生成し、AIエージェントを進化させる技術。「AIエージェントが何度も学習を繰り返すと、学習結果に偏りが発生し、AI群のアウトカムが個別最適の状態に陥り、アウトカムの向上が停滞してしまうことがある。そこで、AI群の間で、AIエージェント同士のモデルのパラメータを掛け合わせることで、新たなAI群を構築。そして、複数生成されたAI群のアウトカムを比較し、アウトカムの劣るAI群は消滅させ、優れたAI群を残す処理を行う。このAI群の生成・消滅処理を、アウトカム向上が収束するまで繰り返していく」(伊藤氏)としている。

「AIエージェント進化技術」の概要

 また同社は、今回の新AI技術の有効性を、サプライチェーン上の複数の企業によるビジネスを模擬した「ビールゲーム」で検証したという。「ビールゲーム」は、小売、卸売、仲卸、工場の独立した4つのエージェントが発注量をそれぞれ決め、サプライチェーン全体で在庫や欠品といった損失を最小にすることを競うもの。

 このゲームでは、予測不能な需要変動の影響を常に受けるのに加え、各エージェントは在庫や欠品などの情報を互いに共有せずに発注量を決めざるをえないという制約があるため、ゲーム参加者間で状況が共有される囲碁のようなゲームに比べて難しい内容となっている。

 伊藤氏は、「ビールゲームで、熟練者が自らの経験に基づいて発注判断を行った場合には、35週で平均2028ドルの損失を出すことが報告されているが、新AI技術を用いたプレイでは、在庫や欠品による損失を約1/4の489ドルまで低減できることを確認した」と、検証結果から、不確定要素の多いビジネスの問題についても、自己競争を活用した学習が有効であることを示すことができたと訴えた。

 今後は、今回開発したAI技術のソースコードを日立グループ内でグローバルに公開し、サービスや製品に組み込むことで、電力・エネルギー、産業・流通・水、アーバン、金融・公共・ヘルスケアなど、幅広い分野における社会イノベーション事業に活用していくことを目指す。