ニュース

サイバーテック、AIの学習データ作成サービス「セブアノ」を提供

 株式会社サイバーテックは14日、AIに必要となる学習データ作成(アノテーション)業務を代行するサービス「セブアノ」を提供開始した。

 セブアノは、サイバーテックがフィリピンのセブ島に有する同社オフショア拠点「セブITアウトソーシングセンター」の正社員で実施する、アノテーションサービス。

 ディープラーニングによるAIモデルの精度向上には、量と質を両方満たす学習データ(教師データ)をリーズナブルに準備することが必要で、また、元となるデータセットには企業内の機密情報が含まれていることが多く、厳格な守秘義務の下、慎重に取り扱う必要があると説明。セブアノでは、守秘義務を順守するとともに、経験豊かな正社員のアノテーションマネージャとアノテーターによるチーム体制で「バラツキ・ 誤差」を排除し、高品質を実現。また、物価水準の低いフィリピン中部のセブエリアで行うことで、リーズナブルにサービスを提供可能としている。

 クラウドソーシングのスタッフでは困難な、難易度の高いアノテーションを得意とし、国内本社と連携した、アノテーション仕様自体へのアドバイスや、指示書見直しにも対応。専任メンバーをアサインする、ラボ型の契約も可能で、通常のワンストップ型よりもさらなるコストダウンを長期的な観点から実現するとしている。

 提供サービスのうち、画像の領域分割(セグメンテーション)では、画像データに対して、仕様に応じて画像の輪郭線情報をポリゴンによりセグメント処理を行った後、クラス付与(ラベリング)によりアノテーションを行う。

画像の領域分割(セグメンテーション)

 画像への特徴点付与(キーポイント)では、画像に写っている人などの対象物の特徴点に座標情報を付与する。動植物や人体などの骨格検出や姿勢推定に利用されており、パーツの各所につけられた座標(キーポイント)をもとに全体像を割り出す。

 画像へのバウンディングボックス付与では、画像データ内の対象となる物体や特徴に対して、矩形(バウンディングボックス)で囲み、同時にそのオブジェクトが何であるかを示すクラス付与と、座標情報のラベル付け(ローカライゼーション)を行う。

 データセットの分類(クラシフィケーション)では、アノテーションの前処理として、カテゴリ分けによるラベリングにより、取捨選択を含め対象データを分類。画像をはじめとする、さまざまな形式のデータ分類に対応する。

 サイバーテックでは、数年前からディープラーニングに取り組んでおり、現在は多言語マニュアルの組み版と電子化を実現するシステム「PMX」のオプションとして、AI校正・ゆらぎ検出機能を提供し、必要とされるデータセットは全てセブITアウトソーシングセンターで作成していると説明。セブアノサービスの中心となる、画像データに対するアノテーション業務においても、学習データの作成ノウハウやディープラーニングの知見を活用し、高品質かつリーズナブルなアノテーションサービスを提供するとしている。