ニュース

リコー、マルチモーダルLLMの基本モデル・評価環境の無償公開を開始

 株式会社リコーは7月31日、同社が開発した、日本企業の図表を含むドキュメントの読み取りに対応可能なマルチモーダル大規模言語モデル(LLM)において、基本モデルと評価環境の無償公開を開始したと発表した。

 このLLMは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」第2期に採択されて開発したもの。図表を含む日本語文書の読解において、視覚情報とテキスト情報の両方を参照する質問応答データセット「JDocQA」、および独自ベンチマークツールによる検証の結果、ほかのモデルと比較しても優れた性能を示すことが確認されているという。

 なお、リコーは、GENIACの第3期でも採択され、企業の知の結晶であるさまざまな企業内ドキュメント群を、多段推論を行うことでより高精度に読み取ることが可能な「リーズニング性能」を持つLMMの開発に取り組むとのこと。

ベンチマークツールにおける他モデルとの比較結果(左:一般的な指標、右:リコーが独自開発した指標による評価)