20 resultados
17 DE JULHO DE 2025 / Gemini
O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
16 DE JULHO DE 2025 / AI
O recurso "logprobs" foi oficialmente introduzido na API Gemini na Vertex AI. Ele fornece insights sobre a tomada de decisões do modelo, mostrando pontuações de probabilidade para tokens escolhidos e alternativos. Este guia passo a passo mostra como ativar e interpretar esse recurso e aplicá-lo a casos de uso poderosos, como classificação confiável, preenchimento automático dinâmico e avaliação quantitativa de RAG.
14 DE JULHO DE 2025 / Gemini
O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.
10 DE JULHO DE 2025 / Gemini
O GenAI Processors é uma nova biblioteca Python de código aberto do Google DeepMind projetada para simplificar o desenvolvimento de aplicativos de IA, especialmente aqueles que lidam com entrada multimodal e exigem capacidade de resposta em tempo real, fornecendo uma interface "Processor" consistente para todas as etapas, desde o tratamento de entradas até as chamadas de modelos e o processamento da saída, para encadeamento contínuo e execução simultânea.
7 DE JULHO DE 2025 / Gemini
O novo modo de lote na API Gemini foi projetado para cargas de trabalho de IA de alta capacidade de processamento e não críticas em relação à latência, simplificando jobs grandes ao lidar com o agendamento e processamento. Além disso, ele torna tarefas como análise de dados, criação de conteúdo em massa e avaliação de modelos mais econômicas e escalonáveis, para que os desenvolvedores possam processar grandes volumes de dados com eficiência.
24 DE JUNHO DE 2025 / Gemini
O Imagen 4, o avançado modelo de texto para imagem do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio, oferecendo melhorias significativas de qualidade, especialmente para geração de texto dentro de imagens. A família Imagen 4 inclui o Imagen 4 para tarefas gerais e o Imagen 4 Ultra para resposta a prompts de alta precisão, com todas as imagens geradas apresentando uma marca d'água SynthID não visível.
24 DE JUNHO DE 2025 / Gemini
O Gemini 2.5 Pro e o Gemini 2.5 Flash estão transformando a robótica ao melhorar a codificação, o raciocínio e os recursos multimodais, incluindo a compreensão espacial. Esses modelos são usados na compreensão semântica de cenas, na geração de código para controle de robôs e na criação de aplicativos interativos com a API Live, com forte ênfase em melhorias de segurança e aplicativos da comunidade.
28 DE MAIO DE 2025 / Gemini
O projeto Magic Mirror utiliza a API Gemini, incluindo a API Live, a chamada de função e o Embasamento com a Pesquisa Google, para criar uma experiência interativa e dinâmica, demonstrando o poder dos modelos Gemini para gerar elementos visuais, contar histórias e fornecer informações em tempo real por meio de um objeto familiar.
9 DE MAIO DE 2025 / DeepMind
O Gemini 2.5 marca um grande salto na compreensão de vídeo, alcançando desempenho de última geração nos principais comparativos de mercado em compreensão de vídeo e usando informações audiovisuais com código e outros formatos de dados.
8 DE MAIO DE 2025 / Gemini
O lançamento do armazenamento em cache implícito na API Gemini expande a API de armazenamento em cache explícito existente, fornecendo um sistema de armazenamento em cache "sempre ativo" que oferece redução de custos automática aos desenvolvedores que usam os modelos Gemini 2.5 e disponibilidade contínua da API de armazenamento em cache explícito para uma economia garantida.