LLMs mit GPUs und Cloud Run-Jobs optimieren

Sie können ein Gemma 3-Modell in einem Cloud Run-Job optimieren und dann das optimierte Modell mit vLLM in einem Cloud Run-Dienst bereitstellen.

Eine detaillierte Anleitung finden Sie im Codelab Ein Modell mit Cloud Run-Jobs optimieren.

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.

Zuletzt aktualisiert: 2025-07-24 (UTC).

LLMs mit GPUs und Cloud Run-Jobs optimieren Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.