ニュース

東芝情報システム、AI開発に向けた教師データを短期間で大量に作成する「自動アノテーションサービス」を提供

 東芝情報システム株式会社は18日、AI開発に向けた高精度な教師データを自動作成する「自動アノテーションサービス」の提供を開始した。

 自動アノテーションサービスは、顧客の教師仕様に基づいた教師例と教師対象データを預かり、高精度な教師データを自動作成し、短期間で提供するサービス。

 自動運転における画像認識をはじめ、さまざまな分野でAIの活用が進む中、AI開発の大部分の時間が、AIの学習に必要な教師データの作成に費やされていると言われており、これは、大量の教師データを手作業で作成していることが主な原因になっているという。

 東芝情報システムでは、画像のセグメンテーション手法を複数組み合わせ、高精度な教師データを作成できる、東芝情報システム独自の自動アノテーションプラットフォームを開発。このプラットフォームは、自動アノテーションに必要となる事前学習を行っており、顧客から預かった少量の教師例を追加学習させることで、顧客仕様に合わせた高精度な教師データを自動作成する。

 開発した自動アノテーションプラットフォームに対して、自動運転向け教師データを作成するベンチマークでは、顧客から預かった教師例とみなした5000枚を追加学習させ、教師データを自動作成したところ、精度(mIoU)84.7%という高精度を実現。このベンチマークでは、1日(24時間)で9600枚の教師データが作成可能で、手作業で作成した場合は、1日(8時間)で16枚の教師データしか作成できないことから、99%以上の作成時間削減が実現できるとしている。

 東芝情報システムは、自動運転における画像認識など、画像のセマンティックセグメンテーションについて、質の高い大量の教師データを必要とする顧客に自動アノテーションサービスを提供し、顧客のAI開発の期間短縮に貢献すると説明。さらに、画像のセマンティックセグメンテーション以外の教師データについても自動アノテーションサービスを対応させ、さまざまなAI開発に携わる顧客の事業発展に貢献していくとしている。

「自動アノテーションサービス」の提供イメージ
「自動アノテーションサービス」で作成した教師データ例