- Google Developers Blog

17 DE JULHO DE 2025 / Gemini

Crie com o Veo 3, já disponível na API Gemini

O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.

Build with Veo 3, now available in the Gemini API and Google AI Studio

16 DE JULHO DE 2025 / AI

Desbloqueie o raciocínio do Gemini: um guia passo a passo para logprobs na Vertex AI

O recurso "logprobs" foi oficialmente introduzido na API Gemini na Vertex AI. Ele fornece insights sobre a tomada de decisões do modelo, mostrando pontuações de probabilidade para tokens escolhidos e alternativos. Este guia passo a passo mostra como ativar e interpretar esse recurso e aplicá-lo a casos de uso poderosos, como classificação confiável, preenchimento automático dinâmico e avaliação quantitativa de RAG.

14 DE JULHO DE 2025 / Gemini

Gemini Embedding com disponibilidade geral na API Gemini

O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.

Gemini Embedding now generally available in the Gemini API

10 DE JULHO DE 2025 / Gemini

Anunciamos o GenAI Processors: crie aplicativos Gemini poderosos e flexíveis

O GenAI Processors é uma nova biblioteca Python de código aberto do Google DeepMind projetada para simplificar o desenvolvimento de aplicativos de IA, especialmente aqueles que lidam com entrada multimodal e exigem capacidade de resposta em tempo real, fornecendo uma interface "Processor" consistente para todas as etapas, desde o tratamento de entradas até as chamadas de modelos e o processamento da saída, para encadeamento contínuo e execução simultânea.

Announcing GenAI Processors: Streamline your Gemini application development

7 DE JULHO DE 2025 / Gemini

Modo de lote na API Gemini: processe mais por menos

O novo modo de lote na API Gemini foi projetado para cargas de trabalho de IA de alta capacidade de processamento e não críticas em relação à latência, simplificando jobs grandes ao lidar com o agendamento e processamento. Além disso, ele torna tarefas como análise de dados, criação de conteúdo em massa e avaliação de modelos mais econômicas e escalonáveis, para que os desenvolvedores possam processar grandes volumes de dados com eficiência.

Scale your AI workloads with batch mode in the Gemini API

24 DE JUNHO DE 2025 / Gemini

O Imagen 4 já está disponível na API Gemini e no Google AI Studio

O Imagen 4, o avançado modelo de texto para imagem do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio, oferecendo melhorias significativas de qualidade, especialmente para geração de texto dentro de imagens. A família Imagen 4 inclui o Imagen 4 para tarefas gerais e o Imagen 4 Ultra para resposta a prompts de alta precisão, com todas as imagens geradas apresentando uma marca d'água SynthID não visível.

Imagen 4 is now available on Gemini API and Google AI Studio

24 DE JUNHO DE 2025 / Gemini

Gemini 2.5 para robótica e inteligência incorporada

O Gemini 2.5 Pro e o Gemini 2.5 Flash estão transformando a robótica ao melhorar a codificação, o raciocínio e os recursos multimodais, incluindo a compreensão espacial. Esses modelos são usados na compreensão semântica de cenas, na geração de código para controle de robôs e na criação de aplicativos interativos com a API Live, com forte ênfase em melhorias de segurança e aplicativos da comunidade.

Gemini 2.5 for robotics and embodied intelligence

28 DE MAIO DE 2025 / Gemini

Conheça o Magic Mirror: uma experiência interativa habilitada pelos modelos Gemini

O projeto Magic Mirror utiliza a API Gemini, incluindo a API Live, a chamada de função e o Embasamento com a Pesquisa Google, para criar uma experiência interativa e dinâmica, demonstrando o poder dos modelos Gemini para gerar elementos visuais, contar histórias e fornecer informações em tempo real por meio de um objeto familiar.

Exploring the Magic Mirror: an interactive experience powered by the Gemini models

9 DE MAIO DE 2025 / DeepMind

Impulso para a compreensão de vídeo com o Gemini 2.5

O Gemini 2.5 marca um grande salto na compreensão de vídeo, alcançando desempenho de última geração nos principais comparativos de mercado em compreensão de vídeo e usando informações audiovisuais com código e outros formatos de dados.

8 DE MAIO DE 2025 / Gemini

Novo suporte dos modelos Gemini 2.5 ao armazenamento em cache implícito

O lançamento do armazenamento em cache implícito na API Gemini expande a API de armazenamento em cache explícito existente, fornecendo um sistema de armazenamento em cache "sempre ativo" que oferece redução de custos automática aos desenvolvedores que usam os modelos Gemini 2.5 e disponibilidade contínua da API de armazenamento em cache explícito para uma economia garantida.

Pesquisa

Tipo de conteúdo

Produto

Tecnologia