Hipercomputador de IA

Apresentamos o Ironwood, nossa TPU mais potente, capaz e eficiente em termos de energia, projetada para impulsionar modelos de IA de raciocínio e inferencial em grande escala.

Hipercomputador de IA

O sistema de supercomputação por trás de todas as cargas de trabalho de IA no Google Cloud. Personalize os componentes usando hardware totalmente integrado, software aberto e modelos de consumo flexíveis.

Blog: Conheça as TPUs Ironwood e as novas inovações no Hipercomputador de IA

Visão geral

Hardware otimizado por IA

Escolha entre opções de computação, armazenamento e rede otimizadas para objetivos granulares no nível da carga de trabalho, seja para maior capacidade de processamento, menor latência, menor tempo para resultados ou menor TCO. Saiba mais sobre: Google Cloud TPU, GPU do Google Cloud, Google Cloud Storage, Titanium, a rede Jupiter.

Potencialize seus LLMs com o Cloud TPU

Saiba como o Cloud TPU, um acelerador de IA personalizado do Google Cloud, otimiza o desempenho das cargas de trabalho de LLM.

Assista sob demanda

Software aberto

O hipercomputador de IA é otimizado para oferecer suporte às ferramentas e bibliotecas mais comuns, como Pytorch e JAX. Além disso, ele permite que os clientes aproveitem tecnologias como as configurações de multislice e multihost do Cloud TPU e serviços gerenciados, como o Google Kubernetes Engine. Dessa forma, os clientes podem fazer implantações prontas para cargas de trabalho comuns, como o framework NVIDIA NeMO orquestrado pelo SLURM (link em inglês).

LLMs de código aberto no GKE: Llama 2 e além

Assista ao vídeo para saber como usar sua plataforma de IA generativa de forma mais avançada.

Assista sob demanda

Consumo flexível

Nossos modelos de consumo flexíveis permitem que os clientes escolham custos fixos com descontos por compromisso de uso ou modelos dinâmicos sob demanda para atender às necessidades dos negócios.O Dynamic Workload Scheduler ajuda os clientes a conseguir a capacidade necessária sem alocação excessiva para que eles paguem apenas pelo que precisam.Além disso, as ferramentas de otimização de custos do Google Cloud automatizam a utilização de recursos para reduzir as tarefas manuais dos engenheiros.

Otimize a economia e o acesso a recursos para cargas de trabalho de IA/ML

Saiba como o Programador dinâmico de cargas de trabalho otimiza a execução das cargas de trabalho de IA.

Leia a postagem do blog

Como funciona

O Google é líder em inteligência artificial com a invenção de tecnologias como o TensorFlow. Você sabia que pode aproveitar a tecnologia do Google nos seus próprios projetos? Saiba mais sobre a história de inovação do Google em infraestruturas de IA e como você pode aproveitá-la em suas cargas de trabalho.

Diagrama da arquitetura do hipercomputador da IA do Google Cloud ao lado da foto da gerente de produtos do Google Cloud, Chelsie

Usos comuns

Executar treinamentos de IA em grande escala

Treinamento de IA avançado, escalonável e eficiente

A arquitetura do hipercomputador de IA oferece opcionalidade para usar a infraestrutura subjacente que melhor se escalone para atender às suas necessidades de treinamento.

Três gráficos que descrevem fatores de crescimento de IA

Tutoriais

Treinamento de IA avançado, escalonável e eficiente

A arquitetura do hipercomputador de IA oferece opcionalidade para usar a infraestrutura subjacente que melhor se escalone para atender às suas necessidades de treinamento.

Outros recursos

Treinamento de IA avançado, escalonável e eficiente

Meça a eficácia do seu treinamento em larga escala do jeito que o Google faz com o goodput de produtividade de ML.

Velocidade de treinamento do TPUv4(bf16) x TPUv5(int8)

Exemplos de clientes

A Character AI usa o Google Cloud para escalonar verticalmente

"Precisamos de GPUs para gerar respostas às mensagens dos usuários. E, à medida que temos mais usuários na nossa plataforma, precisamos de mais GPUs para atendê-los. No Google Cloud, podemos fazer testes para descobrir qual é a plataforma certa para uma carga de trabalho específica. É ótimo ter essa flexibilidade para escolher as soluções mais valiosas." Myle Ott, engenheiro fundador, Character.AI

Myle Ott, engenheiro fundador, Character.AI

1:36

Forneça aplicativos com tecnologia de IA

Use frameworks abertos para oferecer experiências baseadas em IA

O Google Cloud tem o compromisso de garantir que frameworks abertos funcionem bem na arquitetura de hipercomputador de IA.

Tutoriais

Use frameworks abertos para oferecer experiências baseadas em IA

O Google Cloud tem o compromisso de garantir que frameworks abertos funcionem bem na arquitetura de hipercomputador de IA.

Outros recursos

Use frameworks abertos para oferecer experiências baseadas em IA

Com o ecossistema de software aberto do Google Cloud, é possível criar aplicativos com as ferramentas e frameworks que você mais conhece e aproveitar os benefícios de preço-desempenho da arquitetura de hipercomputador de IA.

Ferramentas e frameworks de IA do Google Cloud

Exemplos de clientes

Priceline: ajuda para os viajantes criarem experiências únicas

"Com a ajuda do Google Cloud na incorporação da IA generativa, podemos criar um concierge de viagens personalizado em nosso chatbot. Queremos ajudar nossos clientes a ir muito além do simples planejamento de uma viagem, proporcionando uma experiência de viagem única”. Martin Brodbeck, CTO, Priceline

Disponibilize modelos em escala de maneira econômica

Maximize o preço/desempenho para disponibilizar IA em escala

O Google Cloud oferece preço/desempenho líder do setor para disponibilizar modelos de IA com opção de acelerador e atender às necessidades de qualquer carga de trabalho.

Diagrama da arquitetura de balanceamento de carga com base na profundidade da fila

Tutoriais

Maximize o preço/desempenho para disponibilizar IA em escala

O Google Cloud oferece preço/desempenho líder do setor para disponibilizar modelos de IA com opção de acelerador e atender às necessidades de qualquer carga de trabalho.

Outros recursos

Maximize o preço/desempenho para disponibilizar IA em escala

As instâncias de VM do Cloud TPU v5e e G2 que entregam GPUs NVIDIA L4 permitem inferências econômicas e de alto desempenho para uma ampla variedade de cargas de trabalho de IA, incluindo os modelos mais recentes de LLMs e IA generativa. Ambos oferecem melhorias significativas no desempenho do preço em relação aos modelos anteriores, e a arquitetura de hipercomputador com IA do Google Cloud permite que os clientes escalonem as implantações para níveis líderes do setor.

Desempenho relativo por dólar: Cloud TPU v4 e v5e

O Cloud TPU v5e acelera a inferência de IA em grande escala

Exemplos de clientes

A AssemblyAI usa o Google Cloud para economizar

"Nossos resultados experimentais mostram que o Cloud TPU v5e é o acelerador mais econômico para executar inferência em grande escala no nosso modelo. Ela oferece desempenho por dólar 2,7 vezes maior do que a G2 e desempenho por dólar 4,2 vezes maior do que as instâncias A2." Domenic Donato,

vice-presidente de tecnologia, AssemblyAI

Gravador atende à própria solução de IA com eficiência na GPU do Google Cloud