ニュース
アリババ、ハイブリッド推論を採用したオープンソースLLM「Qwen3」を発表
2025年5月2日 08:00
中国のアリババグループは現地時間4月29日、オープンソース大規模言語モデル(LLM)「通義千問(Qwen)」シリーズの最新世代「Qwen3」を発表した。Qwen3は、ハイブリッド推論による高度な知的処理と、柔軟なスケーラビリティを両立し、AI開発の新たなベンチマークとなることを目指している。
Qwen3シリーズのモデルには、6つの通常型モデル(dense model)と2つの混合専門家(MoE:Mixture-of-Experts)モデルが含まれ、開発者がモバイルディバイス、スマートグラス、自律走行車、ロボティクスなど、多様な分野で次世代アプリケーションを構築する柔軟性を提供する。
Qwen3の全モデル(通常型モデル:0.6B、1.7B、4B、8B、14B、32Bパラメーター)と、MoEモデル(30B〈3Bアクティブ〉、235B〈22Bアクティブ〉)のすべてが世界中でオープンソース化され、開発者が自由に利用できる。
Qwen3は、アリババとして初めて「ハイブリッド推論」モデルを搭載している。従来型LLMの機能に加え、動的かつ高度な推論能力を組み合わせたこのモデルは、数式処理やコーディング、論理的推論などの複雑なタスクに対応する「思考モード」と、高速な汎用応答を提供する「非思考モード」を状況に応じてシームレスに切り替えられる。
API経由でQwen3にアクセスする開発者は、最大3万8000トークンまで思考時間の制御が可能となり、パフォーマンスと計算効率の最適なバランスを実現すると説明。特に、Qwen3-235B-A22B MoEモデルは、他の最先端モデルと比較して展開コストを大幅に低減し、アリババの「誰もが高性能AIを活用できる世界」へのコミットメントを強化したとしている。
アリババグループでは、36兆トークンの巨大なデータセットで訓練されたQwen3は、推論、指示に従う能力、ツールの使用、多言語タスクにおいて、前世代のQwen2.5の2倍の規模で、大幅な進歩を実現していると説明。119の言語と方言に対応し、翻訳や多言語プロンプト処理で、業界トップクラスの精度を実現するとしている。
Qwen3は、Hugging Face、GitHub、ModelScopeで無料公開されており、専用チャットサイト(chat.qwen.ai)でも試用が可能。アリババのAI開発プラットフォーム「Model Studio」経由でのAPI提供も間もなく開始を予定する。また、Qwen3は、アリババの主要なAIアシスタントアプリ「Quark」にも採用されている。