Cette page a été traduite par l'API Cloud Translation.

Regarder nos conférences sur l'IA lors de la conférence I/O 2025

Alexandra Klepper

Publié le 22 mai 2025

L'IA transforme la façon dont les développeurs Web créent des sites Web et des applications Web. Lors du Google I/O 2025, nous avons présenté ce sur quoi nous avons travaillé au cours de l'année écoulée, montré comment nos partenaires utilisent l'IA sur le Web et annoncé de nouvelles API d'IA intégrées.

Vous avez manqué l'événement ? Bonne nouvelle : vous pouvez désormais regarder les conférences à la demande.

IA intégrée pratique avec Gemini Nano dans Chrome

Thomas Steiner

Notre mission principale est de rendre Chrome et le Web plus intelligents pour tous les développeurs et tous les utilisateurs. Dans cette conférence, Thomas Steiner fait le point sur l'IA intégrée, présente des cas d'utilisation pratiques et donne un aperçu de notre avenir.

L'IA intégrée exécute des modèles côté client dans le navigateur, ce qui présente plusieurs avantages:

Privé: les données utilisateur sensibles restent sur l'appareil et ne quittent jamais le navigateur.
Hors connexion: les applications peuvent accéder aux fonctionnalités d'IA, même sans connexion Internet.
Performantes: grâce à l'accélération matérielle, ces API offrent d'excellentes performances.

Consultez des exemples de code pour chacune des API d'IA intégrées, découvrez leur état et identifiez les entreprises qui implémentent cette technologie.

API multimodaux

Nous travaillons sur de nouvelles API multimodales. Vous pouvez donc demander à Gemini Nano ce qu'il "voit" dans un contenu visuel ou "entend" dans un contenu audio. Par exemple, obtenez des suggestions de texte alternatif pour les images importées sur une plate-forme de blog, que les utilisateurs peuvent affiner et modifier. Vous pouvez également demander à Gemini Nano de rédiger des descriptions ou des transcriptions de podcasts.

IA hybride

L'un des défis auxquels les développeurs sont confrontés avec l'IA côté client est que toutes les plates-formes et tous les navigateurs ne répondent pas aux exigences matérielles pour exécuter un modèle sur l'appareil. Gemini et Firebase se sont associés pour créer le SDK Web Firebase afin que, lorsque les implémentations côté client ne sont pas disponibles, vous puissiez utiliser Gemini Nano sur un serveur.

Travailler avec vous

Nous sommes ravis d'avoir collaboré avec autant de développeurs sur les API d'IA intégrées. Sans vous, nous ne pourrions pas faire tout cela.

Programme Preview anticipé: plus de 16 000 développeurs ont rejoint le EPP, en testant de nouvelles API, en découvrant de nouveaux cas d'utilisation et en donnant leur avis pour améliorer l'IA sur le Web.
Hackathons: nous avons organisé deux hackathons, et vous avez créé des sites Web et des extensions incroyables.

Votre travail n'est pas terminé. Continuez à nous faire part de vos commentaires et à tester les nouvelles API intégrées. Nous continuerons à itérer. Vous pouvez même contribuer à la standardisation de ces API en rejoignant le groupe de la communauté Web Machine Learning du W3C.

L'avenir des extensions Chrome avec Gemini dans votre navigateur

Sebastian Benz

Le nombre d'extensions optimisées par l'IA a doublé au cours des deux dernières années. En fait, 10% de toutes les extensions installées à partir du Chrome Web Store utilisent l'IA. Dans cette conférence, Sebastian Benz donne des exemples pratiques pour expliquer pourquoi les extensions Chrome et Gemini sont une combinaison si efficace.

Par exemple, vous pouvez découvrir comment rendre le navigateur plus utile en extrayant et en traitant les données de sites Web sur le client à l'aide de l'API d'invite récemment lancée par Chrome.

Surestimation du potentiel des nouvelles fonctionnalités multimodales de l'API d'invite de Chrome dans les extensions Chrome pour rendre l'audio et les images plus accessibles aux utilisateurs.

Découvrez l'avenir de la navigation en expliquant comment le projet Mariner de Google DeepMind utilise les extensions Chrome et les dernières API Gemini Cloud pour créer un agent de navigateur complet.

Découvrez le potentiel de Gemini dans le cloud ou dans le navigateur dans les extensions Chrome pour créer de nouvelles expériences de navigation et rendre le navigateur plus utile.

Cas d'utilisation et stratégies d'IA Web dans le monde réel

Yuriko Hirota

Swetha Gopalakrishnan

Yuriko Hirota et Swetha Gopalakrishnan ont mis en avant des exemples concrets d'entreprises qui utilisent l'IA sur le Web pour améliorer leur activité et leur expérience utilisateur.Que leur solution utilise des modèles côté client, côté serveur ou une solution hybride, ce qui compte, ce sont les nouvelles fonctionnalités et fonctionnalités passionnantes que vous mettez à la disposition de vos utilisateurs dès maintenant.

BILIBILI a rendu ses diffusions vidéo plus attrayantes grâce à une nouvelle fonctionnalité: les commentaires sur le bullet-screen. Ils proposent des commentaires des utilisateurs en temps réel dans la vidéo, affichés derrière l'orateur. Pour ce faire, elles utilisent la segmentation d'image, un concept de machine learning bien compris. Résultat : la durée des sessions a augmenté de 30 %. Tokopedia a réduit les frictions dans son processus de validation des vendeurs à l'aide d'un modèle de détection de visage pour évaluer la qualité des photos importées. Résultat : les approbations manuelles ont été réduites de près de 70%.

Vision Nanny, une plate-forme Web destinée aux enfants atteints de cécité cérébrale, propose des activités de stimulation visuelle basées sur l'IA. Ils utilisent plusieurs bibliothèques MediaPipe, y compris le modèle de détection des repères des mains, qui localise les points clés des mains dans une image, une vidéo ou en temps réel. Un pilote avec 50 enfants a démontré que Vision Nanny fournissait des réponses cinq fois plus rapidement que les activités de stimulation visuelle manuelles. Les thérapeutes ont déclaré économiser en moyenne trois heures par session en supprimant la configuration manuelle.

Google Meet propose plusieurs fonctionnalités optimisées par l'IA, de l'amélioration de l'éclairage à la réduction du flou et des vidéos floues. Le plus grand défi est que ces fonctionnalités doivent fonctionner en temps réel. C'est là qu'intervient WebAssembly (Wasm), qui exploite toute la puissance du processeur d'un ordinateur et permet le traitement vidéo en temps réel.

Ce ne sont là que quelques exemples concrets de l'IA sur le Web. Plusieurs autres entreprises ont testé les API d'IA intégrées, dont certaines ont partagé leur travail dans des études de cas.

Agents d'IA Web côté client pour créer des expériences utilisateur plus intelligentes

Jason Mayes

Jason Mayes a présenté l'avenir d'Internet: les agents d'IA Web. Le Web a un avenir agentique, apportant des fonctionnalités d'IA directement dans le navigateur pour effectuer des tâches utiles en votre nom, au-delà des capacités des grands modèles de langage (LLM).

Une approche côté client offre une confidentialité améliorée, une latence réduite et des économies de coûts potentielles importantes. Les agents vous permettent de mettre à niveau votre site Web existant, d'effectuer des tâches de manière autonome pour un utilisateur, de sélectionner et d'utiliser de manière dynamique les outils exposés (éventuellement en boucle), ce qui permet à l'agent d'effectuer des tâches potentiellement complexes ou en plusieurs étapes.

Les agents peuvent:

Planifiez et divisez les sous-tâches, en gérant les problèmes plus complexes grâce à une planification en plusieurs étapes pour décomposer la tâche en étapes logiques à accomplir.
Sélectionnez les meilleurs outils, qu'il s'agisse de fonctions, d'une utilisation d'API ou d'un accès au datastore aux connaissances de base du modèle de langage augmenté, puis effectuez des actions sur le monde extérieur.
Conserver la mémoire basée sur le contexte, en fonction des sorties précédentes de l'agent ou des outils externes. La mémoire à court terme agit comme un tampon FIFO de l'historique du contexte jusqu'à la taille de la fenêtre de contexte du modèle, contrairement à la mémoire à long terme, où une base de données vectorielle peut être utilisée pour stocker des informations à rappeler si nécessaire à partir de sessions de conversation précédentes ou d'autres sources de données.

Les agents d'IA Web sont conçus pour s'intégrer aux technologies Web existantes en JavaScript. En fin de compte, il est important que nous continuions à accélérer notre matériel pour exécuter au mieux les modèles dans le navigateur. À l'avenir, des technologies telles que WebNN joueront un rôle clé dans l'optimisation de l'exécution des modèles sur les processeurs, les GPU et les NPU. Avec la tendance à réduire la taille des LLM et les progrès continus, leur puissance ne fera qu'augmenter à l'avenir.

Envisagez d'utiliser une approche hybride, combinant le traitement sur l'appareil et les appels cloud stratégiques, afin de créer des expériences utilisateur intelligentes, réactives et personnalisées dans le navigateur dès maintenant. Le retour sur investissement de votre investissement dans l'approche d'IA Web devrait bientôt porter ses fruits, car les appareils seront de plus en plus capables d'exécuter des LLM.

Revoir Google I/O 2025

Nous avons publié toutes les conférences de Google I/O 2025, avec une playlist dédiée aux développeurs Web. Regardez encore plus de contenus sur io.google/2025.