IA integrada

Kenji Baheux
Kenji Baheux

Publicado em 14 de maio de 2024 e atualizado pela última vez em 20 de maio de 2024

Estamos desenvolvendo APIs da plataforma da Web e recursos do navegador projetados para funcionar com modelos de IA, modelos especializados e modelos de linguagem grandes (LLMs) criados no navegador. Com a IA integrada, seu site ou aplicativo da Web pode realizar tarefas com tecnologia de IA sem precisar implantar, gerenciar ou auto-hospedar modelos de IA.

Descubra os benefícios da IA integrada, nosso plano de implementação e como começar a usar essas ferramentas.

Se você não conhece a IA na Web, leia nosso glossário e conceitos de IA na Web.

Benefícios da IA integrada para desenvolvedores Web

Com a IA integrada, seu navegador fornece e gerencia modelos fundamentais e especializados.

Com a IA integrada, seu site se conecta às APIs do navegador ao processador local (CPU, GPU ou NPU). Em seguida, ele se comunica com um modelo local, que envia uma resposta. A API retorna a resposta.

A IA integrada oferece os seguintes benefícios:

  • Facilidade de implantação: o navegador distribui os modelos, considerando a capacidade do dispositivo, e gerencia as atualizações. Isso significa que você não é responsável por baixar ou atualizar modelos grandes em uma rede. Você não precisa resolver problemas de remoção de armazenamento, cota de memória de tempo de execução, custos de veiculação e outros desafios.
  • Acesso à aceleração de hardware: o tempo de execução de IA do navegador é otimizado para aproveitar ao máximo o hardware disponível, seja com GPU, NPU ou voltando para a CPU. Como resultado, seu app pode ter o melhor desempenho em cada dispositivo.

Benefícios da execução do lado do cliente

Com a IA integrada, é possível realizar a IA do lado do cliente, o que significa que você tem estes benefícios:

  • Processamento local de dados sensíveis: a IA do lado do cliente pode melhorar sua história de privacidade. Por exemplo, se você trabalha com dados sensíveis, pode oferecer recursos de IA aos usuários com criptografia de ponta a ponta.
  • Experiência do usuário rápida: em alguns casos, abandonar a viagem de ida e volta ao servidor significa que você pode oferecer resultados quase instantâneos. A IA do lado do cliente pode ser a diferença entre um recurso viável e uma experiência do usuário abaixo do ideal.
  • Mais acesso à IA: os dispositivos dos usuários podem assumir parte da carga de processamento em troca de mais acesso a recursos. Por exemplo, se você oferece recursos premium de IA, pode mostrar uma prévia deles com IA do lado do cliente para que os clientes em potencial vejam os benefícios do seu produto sem custo adicional para você. Essa abordagem híbrida também pode ajudar a gerenciar os custos de inferência, principalmente em fluxos de usuários usados com frequência.
  • Uso da IA off-line: seus usuários podem acessar recursos de IA mesmo sem conexão de Internet. Isso significa que seus sites e apps da Web podem funcionar como esperado off-line ou com conectividade variável.

IA híbrida: do lado do cliente e do servidor

Embora a IA do lado do cliente possa lidar com uma grande variedade de casos de uso, alguns deles exigem suporte do lado do servidor. A IA do lado do servidor é uma ótima opção para modelos grandes e pode oferecer suporte a uma variedade maior de plataformas e dispositivos.

Considere uma abordagem híbrida se o aplicativo exigir:

  • Complexidade:casos de uso específicos e acessíveis são mais fáceis de oferecer suporte com IA no dispositivo. Para casos de uso complexos, considere a implementação do lado do servidor.
  • Resiliência: use o lado do servidor por padrão e no dispositivo quando ele estiver off-line ou com uma conexão instável.
  • Fallback elegante: a adoção de navegadores com IA integrada vai levar tempo, alguns modelos podem ficar indisponíveis, e dispositivos mais antigos ou menos potentes podem não atender aos requisitos de hardware para executar todos os modelos de maneira ideal. Ofereça IA do lado do servidor para esses usuários.

Por exemplo, se você usar a API Prompt integrada, ela só estará disponível em extensões do Chrome no Windows, macOS e Linux. Para garantir que todos os usuários possam aproveitar o recurso de IA, configure uma arquitetura híbrida com o Firebase AI Logic.

Acessar a IA integrada

É possível acessar os recursos de IA integrados principalmente com APIs de tarefas, como a API Translator ou a API Summarizer. As APIs de tarefa são projetadas para executar inferências com o melhor modelo para a atribuição, seja um modelo de linguagem grande ou especializado.

Quando usar a IA integrada

Confira algumas maneiras como a IA integrada pode beneficiar você e seus usuários:

  • Consumo de conteúdo aprimorado com IA: incluindo resumo, tradução, categorização, caracterização e como provedor de conhecimento.
  • Criação de conteúdo com suporte de IA: como assistência de escrita, revisão, correção gramatical e reformulação.

Várias das APIs de IA integradas estão disponíveis no Chrome estável e em testes de origem. As APIs exploratórias e em estágio inicial estão disponíveis para participantes do Programa de prévia antecipada (EPP).

Conhecer novos recursos

Precisamos da sua opinião para moldar as APIs e ajudar a atender aos seus casos de uso, além de informar nossas discussões com outros fornecedores de navegadores para padronização.

Participe do EPP para dar feedback sobre ideias de IA integradas em estágio inicial e descobrir oportunidades de testar APIs em andamento por meio de prototipagem local.