ニュース
FastLabel、大規模な生成AI開発で必要となるデータセットなど6つのサービスを提供
2025年4月9日 18:00
FastLabel株式会社は9日、大規模な生成AI開発において発生するデータの課題を解決する、「汎用モデル向けデータセット提供」「インストラクションデータ作成」「ファインチューニングサービス」「RAG向けデータセット提供」「RAGデータ作成」「RAGデータ最適化コンサルティング」の6つのサービスを提供開始した。
FastLabelでは、日本の大規模な生成AIモデル開発におけるデータは、量と質において課題があると説明。量の課題は、日本語は英語に比べて主要なサイトなどにおけるインターネット上の公開データが少なく、大規模な学習データを確保しにくいといった背景があるという。また、質の課題は、日本語データの多くはニュース記事やWikipediaなどに偏りがちで、カジュアルな口語表現や最新の流行語、ネットスラング、SNSの会話データなどの情報が不足しているという。
こうした課題を踏まえ、FastLabelでは日本国内における生成AI分野の発展と成長を目指し、6つのサービスを提供する。
「汎用モデル向けデータセット提供」は、汎用的な生成AIモデルを開発または利用するために必要となる、多様なデータセット(画像、動画、音声、テキスト)を提供する。
「インストラクションデータ作成」は、指示文とそれに対する適切な出力例を組み合わせたデータセットを仕様に基づき構築し、モデルの指示理解能力と応答精度を向上させる。
「ファインチューニングサービス」は、特定のタスクやドメイン(医療、建設など)に特化した生成AIモデルを開発するために、モデルをファインチューニングする。
「RAG向けデータセット提供」は、RAGを効果的に行うために、関連性の高い情報を検索・利用するための外部のデータセットを収集、提供する。
「RAGデータ作成」は、ドキュメントやCSVファイルなどさまざまな形式のデータから、RAGに必要な情報を抽出、加工し、ベクトルデータベースに登録するためのデータセットを構築する。
「RAGデータ最適化コンサルティング」は、RAGの効果を最大化するために、データ構造の最適化や、テキスト変換・分割などの構造化処理に関するコンサルティングを提供する。