LLMs mit GPUs und Cloud Run-Jobs optimieren

Sie können ein Gemma 3-Modell in einem Cloud Run-Job optimieren und dann das optimierte Modell mit vLLM in einem Cloud Run-Dienst bereitstellen.

Eine detaillierte Anleitung finden Sie im Codelab Ein Modell mit Cloud Run-Jobs optimieren.