Coloca tus contenedores en Autopilot y ejecuta de forma segura tus cargas de trabajo empresariales a gran escala, con poca o ninguna experiencia en Kubernetes.
Obtén un clúster zonal o de Autopilot gratis por mes. Los clientes nuevos reciben $300 en créditos gratuitos para probar GKE y otros productos de Google Cloud.
Mayor velocidad, menor riesgo y menor TCO
Herramientas integradas de observabilidad y postura de seguridad
Con compatibilidad para hasta 65,000 nodos, creemos que GKE ofrece una escala más de 10 veces mayor que la de los otros dos proveedores de servicios en la nube pública más grandes
Funciones
En previsión de modelos aún más grandes, presentamos la compatibilidad con clústeres de 65,000 nodos. Para desarrollar modelos de IA de vanguardia, los equipos deben poder asignar recursos de procesamiento en diversas cargas de trabajo. Esto incluye no solo el entrenamiento de modelos, sino también la entrega, la inferencia, la investigación ad hoc y la administración de tareas auxiliares. Centralizar la potencia de procesamiento en el menor número de clústeres proporciona la flexibilidad para adaptarse rápidamente a los cambios en la demanda de las cargas de trabajo de entrega de inferencias, investigación y entrenamiento.
Las capacidades de inferencia de GKE con técnicas de escalamiento y balanceo de cargas que tienen en cuenta la IA generativa ofrecen un rendimiento diferenciado para las aplicaciones de IA generativa. Estas capacidades ayudan a reducir los costos de entrega en más de un 30%, la latencia de cola en un 60% y aumentar la capacidad de procesamiento hasta en un 40% en comparación con otras ofertas de Kubernetes administradas y de código abierto.
Con la nueva edición premium GKE Enterprise, los equipos de la plataforma se benefician de una mayor velocidad a través de la configuración y observación de varios clústeres desde un solo lugar. Esto permite definir la configuración para los equipos en lugar de los clústeres y ofrece opciones de autoservicio para que los desarrolladores implementen y administren las apps. Puedes reducir el riesgo con seguridad avanzada y la administración de configuraciones basada en GitOps. Disminuye el costo total de propiedad (TCO) con una solución completamente integrada y administrada, lo que suma hasta un 196% de ROI en tres años.
La edición GKE Standard proporciona una administración del ciclo de vida de los clústeres completamente automatizada, un ajuste de escala automático de Pods y clústeres, la visibilidad de los costos y la optimización automatizada de los costos de la infraestructura. Incluye todos los beneficios existentes de GKE y ofrece los modos de operación Autopilot y Standard. La nueva edición premium GKE Enterprise ofrece todo lo anterior, además de administración, control, seguridad y configuración para múltiples equipos y clústeres, todo con una experiencia unificada de la consola y una malla de servicios integrada.
GKE Autopilot es un modo de operaciones sin intervención que administra el procesamiento subyacente de tu clúster (sin que tengas que configurarlo ni supervisarlo), a la vez que entrega una experiencia completa de Kubernetes. Además, gracias a la facturación por Pod, Autopilot garantiza que solo pagues por los Pods en ejecución y no por los componentes del sistema, la sobrecarga del sistema operativo ni la capacidad no asignada, con hasta un 85% de ahorro en la eficiencia operativa y de recursos. Los modos de operaciones Autopilot y Standard están disponibles como parte de la edición GKE Enterprise.
GKE Threat Detection cuenta con la tecnología de Security Command Center (SCC) y muestra las amenazas que afectan a tus clústeres de GKE casi en tiempo real gracias a la supervisión continua de los registros de auditoría de GKE.
GKE Compliance proporciona estadísticas optimizadas en tiempo real, informes automatizados y la libertad de innovar de forma segura en Google Cloud.
GKE implementa la API completa de Kubernetes, el ajuste de escala automático en cuatro direcciones, los canales de versiones y la compatibilidad con varios clústeres. El ajuste automático de escala horizontal de Pods puede basarse en el uso de CPU o en métricas personalizadas. El ajuste de escala automático de clústeres funciona por grupo de nodos, mientras que el ajuste de escala automático vertical de Pods analiza de forma continua el uso de la CPU y la memoria de los Pods, y ajusta automáticamente las solicitudes de CPU y de memoria.
Aprovecha Kubernetes y la tecnología de nube en tu propio centro de datos a través de Google Distributed Cloud. Obtén la experiencia de GKE con instalaciones simples, administradas y rápidas, además de actualizaciones con la validación de Google.
Reserva un rango de direcciones IP para tu clúster para que las IP de este puedan coexistir con las de la red privada a través de Google Cloud VPN.
Cómo funciona
Un clúster de GKE tiene un plano de control y máquinas llamadas nodos. Los nodos ejecutan los servicios que admiten los contenedores que conforman tus cargas de trabajo. Luego, el plano de control decide qué se ejecuta en esos nodos, incluida la programación y el escalamiento. El modo Autopilot administra esta complejidad; tú solo implementas y ejecutas tus apps.
Usos comunes
Usa flotas para simplificar la forma en que administras las implementaciones de varios clústeres, como separar los entornos de producción de los que no lo son o separar los servicios entre niveles, ubicaciones o equipos. Las flotas te permiten agrupar y normalizar los clústeres de Kubernetes, lo que facilita la administración de la infraestructura y la adopción de las prácticas recomendadas de Google.
Usa flotas para simplificar la forma en que administras las implementaciones de varios clústeres, como separar los entornos de producción de los que no lo son o separar los servicios entre niveles, ubicaciones o equipos. Las flotas te permiten agrupar y normalizar los clústeres de Kubernetes, lo que facilita la administración de la infraestructura y la adopción de las prácticas recomendadas de Google.
Una plataforma sólida de IA y AA tiene en cuenta las siguientes capas: (i) organización de infraestructura que admite GPU para entrenar y entregar cargas de trabajo a gran escala, (ii) integración flexible con frameworks de computación distribuida y procesamiento de datos, y (iii) compatibilidad para que varios equipos trabajen en la misma infraestructura, de modo que se maximice el uso de los recursos.
Una plataforma sólida de IA y AA tiene en cuenta las siguientes capas: (i) organización de infraestructura que admite GPU para entrenar y entregar cargas de trabajo a gran escala, (ii) integración flexible con frameworks de computación distribuida y procesamiento de datos, y (iii) compatibilidad para que varios equipos trabajen en la misma infraestructura, de modo que se maximice el uso de los recursos.
Crea una aplicación web alojada en contenedores, pruébala de forma local y, luego, impleméntala en un clúster de Google Kubernetes Engine (GKE), todo directamente en el editor de Cloud Shell. Al final de este breve instructivo, aprenderás a crear, editar y depurar una app de Kubernetes.
Crea una aplicación web alojada en contenedores, pruébala de forma local y, luego, impleméntala en un clúster de Google Kubernetes Engine (GKE), todo directamente en el editor de Cloud Shell. Al final de este breve instructivo, aprenderás a crear, editar y depurar una app de Kubernetes.
Precios
Cómo funcionan los precios de GKE | Después de que se usan los créditos gratuitos, el costo total se basa en la edición, el modo de operación del clúster, las tarifas de administración de clústeres y las tarifas de transferencia de datos entrantes aplicables. | |
---|---|---|
Servicio | Descripción | Precio (USD) |
Nivel gratuito | El nivel gratuito de GKE proporciona $74.40 en créditos mensuales por cuenta de facturación que se aplican a clústeres zonales y de Autopilot. | Gratis |
Kubernetes | Edición Enterprise Incluye funciones de la edición Standard y operaciones de autoservicio, de varios equipos y de varios clústeres, seguridad avanzada, malla de servicios, configuración y una experiencia unificada de la consola. | $0.0083 Por CPU virtual por hora |
Edición estándar Incluye la administración del ciclo de vida de los clústeres completamente automatizada, el ajuste de escala automático de Pods y clústeres, la visibilidad de los costos y la optimización automatizada de los costos de la infraestructura. | $0.10 Por clúster por hora | |
Procesamiento | Modo Autopilot: Recursos de CPU, memoria y procesamiento que se aprovisionan para tus Pods. Modo Standard: Se te factura por cada instancia según los precios de Compute Engine. | Consulta los precios de Compute Engine |
Obtén más información sobre los precios de GKE. Ver todos los detalles de precios
Cómo funcionan los precios de GKE
Después de que se usan los créditos gratuitos, el costo total se basa en la edición, el modo de operación del clúster, las tarifas de administración de clústeres y las tarifas de transferencia de datos entrantes aplicables.
El nivel gratuito de GKE proporciona $74.40 en créditos mensuales por cuenta de facturación que se aplican a clústeres zonales y de Autopilot.
Gratis
Edición Enterprise
Incluye funciones de la edición Standard y operaciones de autoservicio, de varios equipos y de varios clústeres, seguridad avanzada, malla de servicios, configuración y una experiencia unificada de la consola.
$0.0083
Por CPU virtual por hora
Edición estándar
Incluye la administración del ciclo de vida de los clústeres completamente automatizada, el ajuste de escala automático de Pods y clústeres, la visibilidad de los costos y la optimización automatizada de los costos de la infraestructura.
$0.10
Por clúster por hora
Modo Autopilot: Recursos de CPU, memoria y procesamiento que se aprovisionan para tus Pods.
Modo Standard: Se te factura por cada instancia según los precios de Compute Engine.
Consulta los precios de Compute Engine
Obtén más información sobre los precios de GKE. Ver todos los detalles de precios
Caso empresarial
Moloco: Tiempo de entrenamiento de modelos 10 veces más rápido con TPU en Google Kubernetes Engine
“Ampliar nuestra infraestructura a medida que el negocio de anuncios de Moloco crecía de forma exponencial fue un gran desafío. Las capacidades de escalado automático de GKE permitieron que el equipo de ingeniería se enfocara en el desarrollo sin dedicar mucho esfuerzo a las operaciones”. - Sechan Oh, director de Aprendizaje Automático, Moloco
Al combinar la potencia de NVIDIA NIM con Google Kubernetes Engine, logramos un aumento de 6.1 veces en la velocidad promedio de los tokens. Esto significa que LiveX AI puede ofrecer experiencias personalizadas para los clientes en tiempo real, incluida una asistencia al cliente fluida, recomendaciones de productos instantáneas y una reducción de las devoluciones.
- Jia Li, directora de IA y cofundadora, LiveX AI
“El uso de TPU en GKE, especialmente las TPU Trillium más recientes para la inferencia, en particular para la generación de imágenes, redujo la latencia hasta en un 66%, lo que generó una mejor experiencia del usuario y aumentó los porcentajes de conversiones. Los usuarios reciben respuestas en menos de 10 segundos en lugar de esperar hasta 30 segundos. Esto es fundamental para la participación y retención de los usuarios".
- Cem Ortabas, cofundador, HubX
“Optimizar la relación precio-rendimiento de la inferencia de la IA generativa es clave para nuestros clientes. Nos entusiasma ver la puerta de enlace de inferencia de GKE con su balanceo de cargas optimizado y su extensibilidad de código abierto. Las nuevas capacidades de la puerta de enlace de inferencia de GKE podrían ayudarnos a mejorar aún más el rendimiento de las cargas de trabajo de inferencia de nuestros clientes”.
- Chaoyu Yang, director general y fundador, BentoML
GKE ofrece una escala líder en el sector y una inferencia rentable
“Vimos que la transmisión de imágenes de contenedores en GKE tiene un impacto significativo en la aceleración del tiempo de inicio de nuestra aplicación. La transmisión de imágenes nos ayuda a acelerar el tiempo de inicio de un trabajo de entrenamiento después del envío en un 20%”.
- Juho Kallio, director de Tecnología y cofundador, IPRally
“La nueva compatibilidad de GKE con clústeres más grandes proporciona la escala que necesitamos para acelerar nuestro ritmo de innovación en IA”.
- James Bradbury, director de Procesamiento, Anthropic
“Compute Classes jugó un papel fundamental para ayudar a Shopify a escalar durante nuestros eventos más exigentes”.
- Justin Reid, ingeniero principal, Shopify