Infostand海外ITトピックス

誰もが参加できるAIプロジェクト「InstructLab」 Red Hatが目指す「AIの民主化」

プロジェクトの基盤「LAB」とは

 InstructLabは、「シンプルなユーザーインターフェイスを通じて、個人がモデルを強化できる新しいオープンソースプロジェクト」(SVP兼最高製品責任者のAshesh Badani氏)という。IBMの研究者が3月に発表したアラインメント(人間の価値観に沿わせる調整)の手法「LAB(Large-Scale Alignment for ChatBots)に基づいている。InstructLabのLabは「ラボラトリ」ではなく、このLABから取ったものだ。

 LABは「タクソノミー(分類法)に基づく合成データ生成プロセスと、マルチフェーズなチューニングフレームワークを活用した新しいアプローチ」と説明されている。

 LLMをファインチューニングする際、通常、人間がアノテーション(注釈)を付けた大量のデータを必要とする。だが、それには大きな労力と費用がかかるため、機械生成した合成データで代替することが研究の一つの課題となっている。

 LABは、その解決を目指す手法で、構造化したフレームワークによって少数のデータから多様で幅広い合成データセットを作成する。また学習プロセスには、命令チューニングやプリファレンスチューニングを含む複数のフェーズが含まれ、的確で的を絞った学習が可能。かつスケーラブルだという。

 手順は、(1)人間が自分の知識やスキルの例を挙げる(2)例を見たAIモデルが似たような学習データを多数合成する(3)合成データの品質をチェックする(4)承認されたデータで言語モデルが学習する、というものだ。