ニュース
リコー、日本独自の図表文化に対応したLLM基本モデルを無償公開
2025年6月11日 06:15
株式会社リコーは10日、日本企業の図表を含むドキュメントの読み取りに対応した大規模言語モデル(LLM)の基本モデルを開発したと発表した。経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、日本での生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」に採択され開発した。日本企業独自の複雑なフローチャート、Excelを使った詳細な図表など、海外製LLMでは読み込むことができない図表を読み込めるのが特徴だ。
基本モデルと独自開発したベンチマークツールは無償で提供するが、リコーではこの基本モデルを利用する企業向けのチューニングなどを行い、システムインテグレーション、サービスへの組み込みなどのビジネス化を進める計画だ。今年度中のビジネス化を目指していく。
日本企業の文書の複雑性に対応したLLM技術を開発
リコーでは深層学習の登場以前からAI研究を開始し、OCR技術、検索技術などを開発。生成AI登場後は、生成AIを活用し仕事に活用するための研究や製品化を行ってきた。
LLMについても、2023年3月から、OSSのLLMをベースに独自LLM開発を行っている。
「独自LLMを開発する意義だが、我々は独自LLMを使い、企業が持つ社内文書をうまく活用できるようサポートを行うことを目指している。例えば、製造業にはたくさんの設計図があり、それを読み込んで学習することで自動設計を行う、といったことを実現したいと考えている」(リコー リコーデジタルサービスビジネスユニット AIサービス事業本部 本部長の梅津良昭氏)。
「社内文書を活用したい」という企業が多いものの、紙の文書から必要な情報を探すのは容易ではない。デジタル化することで、「必要な情報を検索して探したい」という声や、そこから進めて「AIを活用し、LLMでQ&A形式から的確な答えを出したい」という要望が増えているという。
しかし、そこで立ちはだかるのが日本企業の文書の複雑さだ。ドキュメントに埋め込まれた図、表などは海外製LLMを使っても読解できず、検索性能も低下している。
「日本企業が利用している文書、具体的な例を挙げると金融や保険業界で利用されている複雑なフローチャート、製造業でよく使われているExcelを使った図表などは、海外製LLMを使ってもほとんど認識しない。これは、海外企業には同様の図表がないことが要因となっている。これらの図表のテキスト部分を読み込む作業は、OCRなどを使っても難しい」(梅津本部長)。
そんな実態が明らかになったことから、リコーはGENIACの生成AI基盤モデル開発第2期に採択され、2024年10月から2025年4月にLLMの開発を行った。
GENIACは、経済産業省とNEDOが立ち上げた、日本国内の基盤モデル開発力を底上げし、企業等の創意工夫を促すための枠組み。リコーは第1期ではアドバイザーとして参加していたが、第2期で自らオリジナルLLM開発に取り組むことになった。
今回、資金提供を受け、学習用データの人工生成の手法を確立し、文字・グラフ・チャートなど合計600万枚以上を整備した。アーキテクチャの改良も行い、同規模のオープンソースモデルをしのぐ性能を出すことに成功。基本モデルと日本語の図表に特化した独自評価環境を公開予定となっている。
技術的な特徴としては、図表を処理するVision Encoder、後段のLLMが理解できる形式に変換するAdapter、図表情報と文字情報を統合処理するLLMの3層構造になっている点が挙げられる。開発の際には、OSSのVEとLLMを複数実装し、組み合わせを変えながら評価して選定を行った。由来が違うため本来は接続できないVE・LLMを、精度を維持しながら接続できるAdapterを開発。最後に3層とも、独自生成した大量の画像で学習して高精度を得ているとした。
基本LLMについては、無償で公開することから、リコー以外の企業がこれを活用したサービスや製品を提供することも可能となる。
その中でリコーとしては、開発を行う中で得た顧客特化で精度向上できる技術をもとに、その企業の独自データをベースとして、精度の高い図表混じり文書の読み込んだサービスを構築するシステムインテグレーション事業や、LLMを取り込んだサービスなどを提供し、ビジネスを展開していく計画だ。