ニュース

「ドコモ画像認識プラットフォーム」に4つの新エンジンを追加、共通学習済みモデルも提供

石井一志

2021年2月25日 09:00

　株式会社NTTドコモは24日、画像認識ソリューションの開発を支援するクラウドサービス「ドコモ画像認識プラットフォーム」を強化したと発表した。認識エンジンの種類を追加したほか、共通学習済みモデル、複数の認識エンジンのAPI組み合わせ機能を新たに提供する。

　「ドコモ画像認識プラットフォーム」は、画像認識を行うための「学習モデル作成」とAPIを提供するクラウドサービス。ソリューション開発者は、AIエンジンの開発コストやサーバー運用コストを抑えつつ、用途にあわせた画像認識エンジンをクラウド上で簡単に作成・利用できるという。

　また、ドコモのネットワーク網と接続したクラウド基盤「ドコモオープンイノベーションクラウド」上に構築しているため、「クラウドダイレクト」と併用することで、インターネットを通ることなく画像データを認識させることが可能。低遅延、高セキュリティが要求される画像認識ソリューションにも利用できるとのこと。

　今回の強化では、新たに3つの機能を提供する。

　まず認識エンジンの種類を拡大し、提供中の「物体検出」エンジンと「一般物体認識」エンジンに加えて、新たに4つのエンジンを利用可能とした。これにより、画像を扱う業務で必要とされる「検出」「分類」「OCR」「人物姿勢推定」「検索」を網羅できるようになったため、従来以上に幅広い業種やニーズに対応できるとしている。

　具体的には、画像から文字を認識する「文字認識」、画像から人物の関節の状態を認識「姿勢推定」、画像から認識した物体の形状や色・柄の特徴量から、類似画像を検索する「類似画像検索」、画像から物体を照合し特定の商品などを認識する「特定物体認識」の4つを利用できる。

　2つ目の共通学習済みモデルでは、画像認識ソリューションでよく使われる物体や文字などについて、学習済みのモデルを用意した。利用企業側での画像データの収集や学習作業が不要になるため、作業負担が軽減されるとともに、申し込みからAPIの利用開始までの期間を短縮可能としている。

　なお、物体検出エンジンでは「顔」、一般物体認識エンジンでは「年齢性別感情推定／ファッション／食べ物／シーン／ランドマーク／花」、文字認識エンジンでは「ゼッケン／活字／手書き」、姿勢推定エンジンでは「人」の各モデルが提供され、利用にあたっては、API利用料金（1エンジン・1学習モデルあたり月額5万5000円）が必要となる。

　3つ目のAPI組み合わせ機能は、組み合わせて利用されることが多い複数のエンジンを1つのAPIに集約し、自動的に連携する機能。APIにアクセスするアプリケーション側で連携機能を作り込む必要がなくなるので、スムーズに利用可能になるとのことだ。今回は、物体検出＋一般物体認識、物体検出＋文字認識、物体検出＋類似画像検索といった3つの組み合わせが用意された。

　この機能はオプションでの提供隣、価格は1組み合わせあたり月額8800円。