ニュース

IBM、AI基盤モデルファミリーの最新版「Granite 3.0」を発表

 米IBMは現地時間21日、年次イベント「TechXchange」において、AIモデルファミリー「Granite 3.0」のリリースを発表した。

 IBMでは、Granite 3.0は、重要なベンチマークにおいて、主要なモデルプロバイダーが提供する同規模のモデルを上回る、もしくは匹敵し、クラス最高の性能、透明性、安全性を示しているとしている。

 Granite 3.0ファミリーには、言語モデルとしてGranite 3.0 2B Instruct、Granite 3.0 8B Base、Granite 3.0 2B Baseのほか、ガードレールと安全性に向けたGranite Guardian 3.0 8B、Granite Guardian 3.0 2B、混合エキスパートのGranite 3.0 3B-A800M Instruct、Granite 3.0 1B-A400M Instruct、Granite 3.0 3B-A800M Base、Granite 3.0 1B-A400M Baseが含まれる。

 新しいGranite 3.0 8Bおよび2B言語モデルは、エンタープライズAI向けの「主力」モデルとして設計されており、検索拡張生成(RAG)、分類、要約、エンティティー抽出、ツール使用などのタスクで、強力なパフォーマンスを発揮すると説明。これらのコンパクトで汎用性の高いモデルは、企業データで微調整し、多様なビジネス環境やワークフローにシームレスに統合できるように設計されているとしている。

 IBMでは、多くの大規模言語モデル(LLM)が一般に公開されているデータで学習されている一方、企業データの大部分は未利用のままだと指摘。IBMとRed Hatが5月に発表したアライメント技術「InstructLab」を活用し、小規模なGraniteモデルを企業データと組み合わせることで、企業は大規模なモデルに匹敵するタスク固有のパフォーマンスを、わずかなコストで達成できると考えられるとして、いくつかの初期の概念実証において、大規模なフロンティアモデルよりも、3倍~23倍コストが低いことが確認されていることを紹介している。

 Granite 3.0のリリースは、AI製品の透明性、安全性、信頼性の構築に対するIBMのコミットメントを再確認するものだと説明。Granite 3.0のテクニカルレポートと責任ある利用ガイドは、これらのモデルの学習に使用されたデータセットの説明、適用されたフィルタリング、クレンジング、キュレーションの手順の詳細、および主要な学術ベンチマークと企業ベンチマークにわたるモデルのパフォーマンスの包括的な結果を提供するとしている。また、重要な点として、IBMはwatsonx.ai上の全てのGraniteモデルに対してIP補償を提供しており、企業の顧客はより確信を持って自社のデータをモデルに統合できるとしている。

 性能面では、Hugging FaceのOpenLLM Leaderboardによって定義された標準的な学術ベンチマークにおいて、Granite 3.0 8B Instructモデルの全体的な平均性能は、MetaやMistralの同規模の最先端のオープンソースモデルを上回っていると説明。IBMの最先端のAttaQ安全性ベンチマークでは、Granite 3.0 8B Instructモデルは、MetaやMistralのモデルと比較して、測定した安全性の全ての基準で上回っているという。

 また、RAG、ツールの使用、およびサイバーセキュリティー領域のタスクの中核となる企業タスクの全体にわたって、Granite 3.0 8B Instructモデルは、MistralやMetaの同規模のオープンソースモデルと比較して、平均してトップクラスのパフォーマンスを示すという。

 Granite 3.0モデルは、日本語を含む12種類の自然言語と116種類のプログラミング言語から収集された、12兆トークンを超えるデータを利用して、データ品質、データ選択、学習パラメーターを最適化するために設計された、数千の実験結果を活用した新しい2段階学習法を用いて学習された。年末までに、Granite 3.0 8Bおよび2B言語モデルは、拡張された128Kのコンテキスト長とマルチモーダル文書理解機能をサポートする予定。

 IBMは、パフォーマンスと推論コストのバランスに優れたGranite混合エキスパートモデル、Granite 1B A400MおよびGranite 3B A800Mを、CPUベースの展開だけでなく、低レイテンシーのアプリケーションにも展開可能な小型軽量モデルとして提供している。

 また、IBMが2024年初めに最初のバージョンをリリースした、事前学習済みのGranite時系列モデルの更新版のリリースを発表した。これらの新しいモデルは、3倍以上のデータで学習され、3つの主要な時系列ベンチマーク全てにおいて、GoogleやAlibabaなどが提供する10倍以上のサイズのモデルを上回る、強力な性能を発揮すると説明。更新されたモデルはまた、外部変数とローリング予測をサポートすることで、より柔軟なモデリングを提供するとしている。

 IBMは、今回のリリースの一環として、アプリケーション開発者がユーザーのプロンプトや大規模言語モデル(LLM)の応答を、さまざまなリスクの観点から確認することで安全対策を導入できる、Granite Guardianの新シリーズも発表した。Granite Guardian 8Bおよび2Bモデルは、現在市場で入手可能なリスクおよび有害性検出機能の中で、最も包括的なセットを提供するとしている。

 社会的偏見、憎悪、攻撃性、冒瀆(ぼうとく)、暴力、ジェイル・ブレイキングなどの有害性に加えて、これらのモデルは、根拠、文脈の関連性、回答の関連性といったRAG特有のチェックも提供する。19の安全性とRAGベンチマークにわたる広範なテストにおいて、Granite Guardian 3.0 8Bモデルは、MetaのLlama Guardモデルの3世代全てよりも、有害性検出において全体的に高い平均精度を示したと説明。また、ハルシネーション検出においても、このタスクに特化したモデルであるWeCheckやMiniCheckと比較して、平均して同等の総合的な性能を示したという。

 Granite Guardianモデルは、対応するGraniteの言語モデルから派生したものだが、オープンまたは専有のAIモデルと併用してガードレールを実装するためにも利用できる。

 全てのGranite 3.0モデルと更新版の時系列モデルは、Hugging Face上で寛容型のApache 2.0ライセンスのもとでダウンロード可能。新しいGranite 3.0 8Bおよび2B言語モデルとGranite Guardian 3.0 8Bおよび2Bモデルの指示追従モデルは、IBMのwatsonxプラットフォーム上で商用利用が可能。Granite 3.0モデルの一部は、NVIDIA NIMマイクロサービスとして、またGoogle CloudのVertex AI Model GardenとHugging Faceとの統合を通じて利用できるようになる。

 また、IBMでは、Graniteコードモデルを搭載し、C、C++、Go、Java、Pythonなどの言語に対する汎用的なコーディング支援や、エンタープライズJavaの先進的なアプリケーションモダナイゼーション機能を提供する、次世代watsonx Code Assistantの次期リリースも発表した。これにより、Graniteのコード機能は、Visual Studio Codeの拡張機能であるIBM Granite.Codeからもアクセスできるようになった。

 さらに、AIを活用したデリバリープラットフォームであるIBM Consulting Advantageの大幅な拡張を発表した。このマルチモデルプラットフォームには、AIエージェントやアプリケーション、反復可能なフレームワークのようなメソッドが含まれており、16万人のIBMコンサルタントがより優れた顧客価値を、より迅速に、より低コストで提供できるようにするとしている。