ニュース

「ドコモ画像認識プラットフォーム」に4つの新エンジンを追加、共通学習済みモデルも提供

 株式会社NTTドコモは24日、画像認識ソリューションの開発を支援するクラウドサービス「ドコモ画像認識プラットフォーム」を強化したと発表した。認識エンジンの種類を追加したほか、共通学習済みモデル、複数の認識エンジンのAPI組み合わせ機能を新たに提供する。

 「ドコモ画像認識プラットフォーム」は、画像認識を行うための「学習モデル作成」とAPIを提供するクラウドサービス。ソリューション開発者は、AIエンジンの開発コストやサーバー運用コストを抑えつつ、用途にあわせた画像認識エンジンをクラウド上で簡単に作成・利用できるという。

 また、ドコモのネットワーク網と接続したクラウド基盤「ドコモオープンイノベーションクラウド」上に構築しているため、「クラウドダイレクト」と併用することで、インターネットを通ることなく画像データを認識させることが可能。低遅延、高セキュリティが要求される画像認識ソリューションにも利用できるとのこと。

 今回の強化では、新たに3つの機能を提供する。

 まず認識エンジンの種類を拡大し、提供中の「物体検出」エンジンと「一般物体認識」エンジンに加えて、新たに4つのエンジンを利用可能とした。これにより、画像を扱う業務で必要とされる「検出」「分類」「OCR」「人物姿勢推定」「検索」を網羅できるようになったため、従来以上に幅広い業種やニーズに対応できるとしている。

 具体的には、画像から文字を認識する「文字認識」、画像から人物の関節の状態を認識「姿勢推定」、画像から認識した物体の形状や色・柄の特徴量から、類似画像を検索する「類似画像検索」、画像から物体を照合し特定の商品などを認識する「特定物体認識」の4つを利用できる。

 2つ目の共通学習済みモデルでは、画像認識ソリューションでよく使われる物体や文字などについて、学習済みのモデルを用意した。利用企業側での画像データの収集や学習作業が不要になるため、作業負担が軽減されるとともに、申し込みからAPIの利用開始までの期間を短縮可能としている。

 なお、物体検出エンジンでは「顔」、一般物体認識エンジンでは「年齢性別感情推定/ファッション/食べ物/シーン/ランドマーク/花」、文字認識エンジンでは「ゼッケン/活字/手書き」、姿勢推定エンジンでは「人」の各モデルが提供され、利用にあたっては、API利用料金(1エンジン・1学習モデルあたり月額5万5000円)が必要となる。

 3つ目のAPI組み合わせ機能は、組み合わせて利用されることが多い複数のエンジンを1つのAPIに集約し、自動的に連携する機能。APIにアクセスするアプリケーション側で連携機能を作り込む必要がなくなるので、スムーズに利用可能になるとのことだ。今回は、物体検出+一般物体認識、物体検出+文字認識、物体検出+類似画像検索といった3つの組み合わせが用意された。

 この機能はオプションでの提供隣、価格は1組み合わせあたり月額8800円。