生成の処理はprefillとdecodeの2つのステップからなる。prefillはGPUがひたすら計算

生成の処理はprefillとdecodeの2つのステップからなる。prefillはGPUがひたすら計算