ニュース

東芝デジタルソリューションズ、映像内の文字情報をAIで認識する「モジメタ」を提供

 東芝デジタルソリューションズ株式会社は18日、映像コンテンツを扱う放送局などのメディア企業向けに、AIテロップ文字認識「モジメタ」を提供開始した。

 「モジメタ」は、映像に含まれるテロップなどの文字情報を、1秒に数フレームの細かい間隔で認識し、高い精度でデジタルデータに変換することで、どのタイミングで映像のどの位置にどのサイズのテロップが表示されているかを抽出できるサービス。

 映像に含まれるテロップなどの文字情報を高い精度で認識し、デジタルデータ化することで、特定シーンの抽出作業の迅速化や、テロップミスや不適切表現の自動検出による映像の確認作業の品質向上など、文字情報に関わる幅広い業務をサポートする。

文字情報に関わる課題と「モジメタ」のユースケース

 東芝グループが50年以上培ってきたOCR技術のノウハウに、最新のディープラーニング技術を融合させた、東芝独自の文字認識技術を採用することで、高い文字認識精度を実現した。一般的なOCRでは正確な認識が難しい、テロップ特有の飾り文字やフォント、複雑な配色や背景、低解像度の映像などにも対応する。

 また、「モジメタ」がデジタルデータ化したテロップと、放送局が独自に定めている放送に不適切な用語辞書とを照合して確認作業を標準化することや、東芝デジタルソリューションズの顔認識AI「カオメタ」と組み合わせることで、映像内の人物に対して正確なテロップが付与されているかを効率的に確認することもできる。

 東芝デジタルソリューションズでは、「モジメタ」の開発にあたり、放送局の協力を得て、番組の最後に流れるエンドロールのデジタルデータ化業務への適合性を評価した。エンドロールは限られた時間内に、スタッフ名や楽曲名、技術・ロケの協力先名など多くの情報を表示し、中には高速で表示する番組もあり、人手による書き起こし作業に多くの時間が費やされていた。ドラマ、バラエティ番組、映画などさまざまな番組の形式が異なるエンドロールの書き起こし作業を、「モジメタ」を利用して行ったところ、正確かつ迅速にデジタルデータ化できることが確認できたという。

 東芝デジタルソリューションズは今後も、放送局の貴重な映像資産であるアーカイブ映像のマルチユースの促進や、番組制作現場の負荷軽減など、放送局の業務に寄り添う機能の拡充を進めていくとしている。

「モジメタ」が提供するテロップ認識処理の流れ