ニュース

富士通研究所と熊本大学、時系列データのAI利用のための教師データを自動で作成するラベル付け技術を開発

 株式会社富士通研究所と国立大学法人熊本大学は10日、加速度センサーやジャイロセンサーなどの時系列データに対して、AIを適用する上で必要な教師データを簡単に作成できる技術を開発したと発表した。

 センサーから得られる時系列データは、それぞれの瞬間での値が数値で記録されているだけのため、「いつ」(区間)、「何を」(ラベル)したかを付与してデータに意味付けを行い、AIが学習するための教師データを作成する必要がある。例えば、ランニングの際の加速度センサーのデータでは、走っている状態、歩いている状態、止まっている状態などが混在しており、これらのデータをAIに学習させるには、それぞれのデータを区間に切り分けて、「走っている」「歩いている」「止まっている」といったラベルを付与した教師データを作成する必要がある。

 従来、このような教師データを作成するには、時系列データを測定している最中にビデオで振るまいを録画しておき、秒単位で変化する数値に対してどの振るまいをしているのか照らし合わせた上で、人手でラベルを付与するのが一般的だったが、この作業は大きな負担と時間がかかるため、時系列データのAIへの適用が進まず、ラベル付与作業の手間を削減する自動化技術が求められていたという。

 こうした課題に対し、富士通研究所と熊本大学では、複数の動作を含む場合でも、主に「何を」しているかを表すラベルを長区間(例えば1時間)につき1つ入力するだけで、時系列データのAI利用を可能とする高精度な教師データを自動で作成する技術を開発した。

 開発した技術では、時系列データの中で、同じ動作が継続している時の特徴と動作が変化する時の特徴を学習し、時系列データから同じ特徴を持つ動作の時間帯を適切に自動抽出することを可能とした。

 また、長区間ごとのデータに対して、大半が走っている場合には「走っている」という大雑把なラベルを1つ付与しておき、これらのラベルを予測できるようにディープニューラルネットワークを学習させた後、この学習済みのディープニューラルネットワークを使って時系列データを読み込ませ、結果として出てきた推定ラベルから、時系列データのどの区間が最も予測に寄与したかを計算する。その寄与度が高い時間帯をラベル候補として集計していくことで、高度な予測が可能な教師データを作成できる。

 この技術を利用し、工場における研磨などの作業を模した動作からなる加速度センサーの時系列データに対して、ラベルを付与する実験を実施したところ、92%の時間帯で正しくラベル付けができたことを確認。これは、人手でラベルを細かく付与したデータを教師データとした時と同等の高精度な結果であることが認められるとしている。

 今回開発した技術により、時系列データからAI用の教師データを容易に作成できるため、センサーがとらえた特徴をAIが判断するような機能の開発が進むことが期待されると説明。また、技術は時系列データの数値の特徴だけから判断を行い、センサーの種類には依存しないため、温度センサーや脈波センサーなどにも適用できるとしている。

 今後は、さまざまな分野の時系列データを用いた実証実験を進め、富士通株式会社のAI技術「FUJITSU Human Centric AI Zinrai」の時系列データ向け前処理技術として、2019年度中の実用化を目指すとしている。