컨테이너를 Autopilot으로 설정하고 엔터프라이즈 워크로드를 규모에 맞게 안전하게 실행합니다. 필요한 Kubernetes 관련 전문 지식이 거의 없거나 전혀 없습니다.
매월 영역 클러스터 또는 Autopilot 클러스터 1개가 무료로 제공됩니다. 신규 고객에게는 $300의 무료 크레딧이 제공되어 GKE 및 다른 Google Cloud 제품을 사용해 볼 수 있습니다.
기능
더 큰 모델을 지원하기 위해 65,000개 노드 클러스터 지원을 도입하고 있습니다. 최첨단 AI 모델을 개발하려면 팀에서 다양한 워크로드에 컴퓨팅 리소스를 할당할 수 있어야 합니다. 여기에는 모델 학습뿐만 아니라 서빙, 추론, 임시 연구 수행, 보조 작업 관리가 포함됩니다. 최소한의 클러스터 내에서 컴퓨팅 성능을 중앙 집중화하면 추론 서빙, 연구, 학습 워크로드의 수요 변화에 신속하게 적응할 수 있는 유연성을 제공합니다.
생성형 AI 인식 확장 및 부하 분산 기법을 갖춘 GKE 추론 기능은 생성형 AI 애플리케이션에 차별화된 성능을 제공합니다. 이러한 기능은 다른 관리형 및 오픈소스 Kubernetes 제품에 비해 서빙 비용을 30% 이상 줄이고 지연 시간을 60% 줄이며 처리량을 최대 40%까지 높일 수 있도록 지원합니다.
새로운 프리미엄 GKE Enterprise 버전을 사용하면 플랫폼팀이 한곳에서 여러 클러스터를 구성 및 관찰하고, 클러스터가 아닌 팀 구성을 정의하고, 개발자에게 앱 배포 및 관리를 위한 셀프서비스 옵션을 제공하여 작업 속도를 높일 수 있습니다. 고급 보안 및 GitOps 기반 구성 관리를 사용하여 위험을 줄일 수 있습니다. 완전 통합된 관리형 솔루션으로 총소유비용(TCO)을 낮춰 3년 내에 ROI를 최대 196%까지 높일 수 있습니다.
GKE Standard 버전은 완전 자동화된 클러스터 수명 주기 관리, 포드 및 클러스터 자동 확장, 비용 가시성, 자동화된 인프라 비용 최적화를 제공합니다. GKE의 모든 기존 이점을 포함하며 Autopilot과 Standard 작업 모드를 모두 제공합니다. 새로운 프리미엄 GKE Enterprise 버전은 앞서 언급한 모든 기능과 더불어 여러 팀과 클러스터에 대한 관리, 거버넌스, 보안, 구성 기능 등 모든 기능을 통합된 콘솔 환경과 통합 서비스 메시를 통해 제공합니다.
Security Command Center(SCC)에서 제공하는 GKE Threat Detection는 GKE 감사 로그를 지속적으로 모니터링하여 GKE 클러스터에 영향을 미치는 위협을 거의 실시간으로 보여줍니다.
GKE Compliance를 통해 간소화된 실시간 통계, 자동화된 보고서, Google Cloud에서 안전하게 혁신할 수 있는 자유를 누릴 수 있습니다.
GKE는 완전한 Kubernetes API, 4방향 자동 확장, 출시 채널, 멀티 클러스터 지원을 구현합니다. CPU 사용률 또는 커스텀 측정항목을 기준으로 수평형 포드 자동 확장을 실행할 수 있습니다. 클러스터 자동 확장은 노드 풀별로 작동하며 수직형 포드 자동 확장은 지속적으로 포드의 CPU 및 메모리 사용량을 분석하여 CPU 및 메모리 요청을 자동으로 조정합니다.
Google Distributed Cloud를 통해 자체 데이터 센터에서 Kubernetes 및 클라우드 기술을 활용할 수 있습니다. Google에서 검증한 빠르고 간단한 관리형 설치 및 업데이트로 GKE 환경을 조성할 수 있습니다.
클러스터에 사용할 IP 주소 범위를 예약하여 Google Cloud VPN을 사용하여 클러스터 IP를 비공개 네트워크 IP와 동시에 사용할 수 있습니다.
일반적인 용도
Fleet를 사용하면 비프로덕션 환경에서 프로덕션 구분 또는 여러 등급, 위치 또는 팀 간에 서비스 구분과 같은 멀티 클러스터 배포를 관리하는 방식을 간소화할 수 있습니다. Fleet를 사용하면 Kubernetes 클러스터를 그룹화하고 정규화할 수 있으므로 더 간편하게 인프라를 관리하고 Google 권장사항을 채택할 수 있습니다.
강력한 AI/ML 플랫폼은 (i) 대규모 워크로드 학습 및 서빙을 위해 GPU를 지원하는 인프라 조정 (ii) 분산 컴퓨팅 및 데이터 처리 프레임워크와의 유연한 통합 (iii) 동일한 인프라에서 여러 팀을 지원하여 리소스 활용 극대화 등의 계층을 고려합니다.
강력한 AI/ML 플랫폼은 (i) 대규모 워크로드 학습 및 서빙을 위해 GPU를 지원하는 인프라 조정 (ii) 분산 컴퓨팅 및 데이터 처리 프레임워크와의 유연한 통합 (iii) 동일한 인프라에서 여러 팀을 지원하여 리소스 활용 극대화 등의 계층을 고려합니다.
Cloud Shell 편집기에서 직접 컨테이너화된 웹 앱을 만들어 로컬에서 테스트한 후 Google Kubernetes Engine(GKE) 클러스터에 배포할 수 있습니다. 이 간단한 튜토리얼을 마치고 나면 Kubernetes 앱을 빌드, 수정, 디버그하는 방법을 이해할 수 있게 됩니다.
Cloud Shell 편집기에서 직접 컨테이너화된 웹 앱을 만들어 로컬에서 테스트한 후 Google Kubernetes Engine(GKE) 클러스터에 배포할 수 있습니다. 이 간단한 튜토리얼을 마치고 나면 Kubernetes 앱을 빌드, 수정, 디버그하는 방법을 이해할 수 있게 됩니다.
가격 책정
GKE 가격 책정 방식 | 무료 크레딧을 사용한 후 버전, 클러스터 작업 모드, 클러스터 관리 수수료, 적용 가능한 인바운드 데이터 전송 수수료를 기준으로 총 비용이 청구됩니다. | |
---|---|---|
서비스 | 설명 | 가격(USD) |
무료 등급 | GKE 무료 등급은 결제 계정당 영역 및 Autopilot 클러스터에 적용되는 월 $74.40의 크레딧을 제공합니다. | 무료 |
Kubernetes | Enterprise 버전 Standard 버전에는 기능과 멀티 팀, 멀티 클러스터, 셀프서비스 운영, 고급 보안, 서비스 메시, 구성, 통합 콘솔 환경이 포함됩니다. | $0.0083 vCPU별 시간당 |
Standard 버전 완전 자동화된 클러스터 수명 주기 관리, 포드 및 클러스터 자동 확장, 비용 가시성, 자동화된 인프라 비용 최적화를 제공합니다. | $0.10 클러스터별 시간당 | |
컴퓨팅 | Autopilot 모드: 포드에 CPU, 메모리, 컴퓨팅 리소스가 프로비저닝 됩니다. Standard 모드: Compute Engine 가격 책정에 따라 각 인스턴스에 대해 요금이 청구됩니다. | Compute Engine 가격 책정 참고 |
GKE 가격 책정 자세히 알아보기 모든 가격 책정 세부정보 보기
GKE 가격 책정 방식
무료 크레딧을 사용한 후 버전, 클러스터 작업 모드, 클러스터 관리 수수료, 적용 가능한 인바운드 데이터 전송 수수료를 기준으로 총 비용이 청구됩니다.
Enterprise 버전
Standard 버전에는 기능과 멀티 팀, 멀티 클러스터, 셀프서비스 운영, 고급 보안, 서비스 메시, 구성, 통합 콘솔 환경이 포함됩니다.
$0.0083
vCPU별 시간당
Standard 버전
완전 자동화된 클러스터 수명 주기 관리, 포드 및 클러스터 자동 확장, 비용 가시성, 자동화된 인프라 비용 최적화를 제공합니다.
$0.10
클러스터별 시간당
Autopilot 모드: 포드에 CPU, 메모리, 컴퓨팅 리소스가 프로비저닝 됩니다.
Standard 모드: Compute Engine 가격 책정에 따라 각 인스턴스에 대해 요금이 청구됩니다.
Compute Engine 가격 책정 참고
GKE 가격 책정 자세히 알아보기 모든 가격 책정 세부정보 보기
비즈니스 사례
Moloco: Google Kubernetes Engine에서 TPU를 사용해 10배 빠른 모델 학습
"Moloco Ads 비즈니스가 기하급수적으로 성장함에 따라 인프라를 확장하는 것은 큰 도전이었습니다. GKE의 자동 확장 기능 덕분에 엔지니어링팀은 운영에 많은 노력을 들이지 않고도 개발에 집중할 수 있었습니다." - 오세찬, Moloco 머신러닝 부문 이사
NVIDIA NIM의 강력한 성능과 Google Kubernetes Engine을 결합하여 평균 토큰 속도를 6.1배 향상시켰습니다. 즉, LiveX AI는 원활한 고객 지원, 즉각적인 제품 추천, 반품 감소 등 고객에게 실시간으로 맞춤설정된 경험을 제공할 수 있습니다.
- 지아 리, LiveX AI 공동 설립자 겸 최고 AI 책임자
"GKE에서 TPU, 특히 이미지 생성에서 추론을 위한 최신 Trillium을 사용하면 지연 시간이 최대 66% 감소하여 사용자 경험이 개선되고 전환율이 증가합니다. 최대 30초까지 기다릴 필요 없이 10초 이내에 응답을 받을 수 있습니다. 이는 사용자 참여와 유지에 매우 중요한 요소입니다."
- 젬 오르타바스, HubX 공동 설립자
"생성형 AI 추론의 가격 대비 성능을 최적화하는 것은 고객에게 중요한 요소입니다. 최적화된 부하 분산 및 확장성을 갖춘 GKE Inference Gateway가 오픈소스로 제공되어 기쁩니다. 새로운 GKE Inference Gateway 기능은 고객의 추론 워크로드 성능을 더욱 개선하는 데 도움이 될 수 있습니다."
- 차오유 양, BentoML CEO 겸 설립자
업계 최고의 확장성과 비용 효율적인 추론을 제공하는 GKE
"GKE의 컨테이너 이미지 스트리밍이 애플리케이션 시작 시간을 단축하는 데 큰 영향을 미친다는 사실을 확인했습니다. 이미지 스트리밍을 사용하면 제출 후 학습 작업의 시작 시간을 20% 단축할 수 있습니다."
- 유호 칼리오, IPRally CTO 겸 공동 설립자
"컴퓨팅 클래스는 Shopify가 가장 까다로운 이벤트를 처리하는 동안 확장하는 데 중요한 역할을 했습니다."
- 저스틴 리드, Shopify 수석 엔지니어