RHEL 10、OpenShift Virtualization、そして推論AI――、AI時代に向けてRed Hatが示した“what's next”への布石(13/14)

大規模分散環境における推論AIのスケーリングを目的に、Red Hatがパートナーとローンチしたオープンソースプロジェクトllm-dは、vLLMとKubernetesをベースにしている。ルーティング機能としてKubernetesのGateway APIを機能拡張したInference Gatewayを採用し、推論処理の能力に応じてスケーリングする