(Mountain View, Californie) En mai dernier, Sundar Pichai, PDG de Google, a annoncé que l’entreprise utiliserait l’intelligence artificielle pour réimaginer l’ensemble de ses produits.

Mais cette nouvelle technologie présente des risques, comme diffuser de fausses informations, et Google s’est montré prudent avant de l’appliquer à son moteur de recherche utilisé par plus de 2 milliards de personnes et qui a généré 175 milliards US en revenus en 2023.

Mardi, lors de la conférence annuelle de Google à Mountain View, en Californie, M. Pichai a montré comment le travail de ses développeurs en IA a percolé jusqu’à Google Search. Dès cette semaine, les utilisateurs américains verront apparaître la fonctionnalité « AI Overviews », qui génère des résumés au-dessus des résultats de recherche traditionnels. D’ici la fin de 2024, plus de 1 milliard de personnes y auront accès.

Craintes chez les éditeurs et créateurs

AI Overviews fait craindre aux éditeurs de sites web que Google Search leur amène moins de visiteurs, ce qui accentuerait la pression sur un secteur fragilisé par des conflits avec d’autres plateformes. Google fournira des résumés assez longs, réduisant ainsi la nécessité d’aller sur un autre site web.

Google minimise ces inquiétudes. Selon Liz Reid, vice-présidente de la recherche chez Google, « les liens au bas des aperçus IA obtiennent plus de clics » que s’ils étaient présentés comme des résultats de recherche traditionnels. « L’envoi de trafic de haute valeur aux éditeurs et aux créateurs » demeure une priorité, dit-elle.

PHOTO JEFF CHIU, ASSOCIATED PRESS

Sundar Pichai, PDG de Google

L’entreprise a également dévoilé une série d’autres initiatives – notamment un modèle d’IA allégé, de nouvelles puces et des « agents » facilitant certaines tâches – qui visent à assurer sa suprématie en IA sur ses rivaux Microsoft et OpenAI, le fabricant de ChatGPT.

Nous sommes au tout début du passage à l’IA, a déclaré M. Pichai mardi lors de la conférence I/O de Google destinée aux développeurs. Nous voulons que tout le monde profite de ce que Gemini peut faire, développeurs, start-up et grand public.

Sundar Pichai, lors de la conférence I/O de Google destinée aux développeurs

Quand OpenAI a lancé ChatGPT fin 2022, certains experts l’ont perçu comme une menace sérieuse pour Google Search, le moteur de recherche le plus populaire. Depuis lors, Google s’est efforcé de reprendre le dessus en IA, en lançant une famille de technologies appelée Gemini, comprenant de nouveaux modèles d’IA pour les développeurs et le robot conversationnel pour les consommateurs. Google a aussi intégré de l’IA dans YouTube, Gmail et Docs, afin de faciliter la création de vidéos, de courriels et de textes.

Pendant ce temps, la lutte de Google avec OpenAI et son partenaire Microsoft s’est poursuivie. La veille de la conférence de Google, OpenAI a présenté une nouvelle version de ChatGPT plus proche d’un assistant vocal.

Lors de sa conférence de mardi, Google a montré comment il comptait intégrer l’IA plus profondément dans la vie des utilisateurs.

Projet Astra

Il a présenté le projet Astra, qui vise à déterminer comment l’IA pourrait agir en tant qu’agent, en discutant de vive voix avec les utilisateurs et en réagissant aux images et vidéos. Certaines de ces fonctions seront intégrées au robot conversationnel Gemini de Google cette année, a indiqué Demis Hassabis, patron de DeepMind, le laboratoire d’IA de Google.

DeepMind a présenté Gemini 1,,5 Flash, un modèle d’IA censé être rapide et efficace, mais allégé par rapport à Gemini 1.5 Pro, le modèle intermédiaire déployé dans un grand nombre de services grand public de Google. Gemini 1.5 Flash est « très performant » en matière de raisonnement et sait résumer des informations, converser et sous-titrer des images et des vidéos, a dit M. Hassabis.

Google a annoncé un autre modèle d’IA, Veo, censé générer des vidéos en haute définition à partir de simples sollicitations textuelles, à l’instar du système Sora d’OpenAI. Certains créateurs pourront tester Veo en avant-première et d’autres pourront s’inscrire sur une liste d’attente. D’ici la fin de l’année, Google prévoit intégrer certaines fonctionnalités de Veo à YouTube Shorts, le concurrent de TikTok sur la plateforme vidéo, ainsi qu’à d’autres produits.

Générateur de musique

Google a aussi présenté les dernières versions de son outil générateur de musique, Lyria, et de son générateur d’images, Imagen 3. En février, Gemini avait été critiqué par des utilisateurs parce qu’il refusait de générer des images de personnes blanches et présentait des images inexactes de personnages historiques.

Google avait alors suspendu la génération d’images de personnes jusqu’à ce qu’il ait résolu le problème.

Google a indiqué que plus de 1 million d’utilisateurs se sont inscrits – pour 20 $ US par mois – à Gemini Advanced, la version payante du robot conversationnel, durant le dernier trimestre.

Dans les prochains mois, Google ajoutera Gemini Live, qui permettra aux utilisateurs de s’adresser verbalement au robot. Gemini aura des voix naturelles, dit Google, et les utilisateurs pourront même lui couper la parole pour poser des questions plus précises. Plus tard en 2024, les utilisateurs pourront se servir de leur appareil photo pour montrer à Gemini Live le monde matériel qui les entoure et en parler avec lui.

Outre les aperçus IA, Google Search présentera des pages de résultats de recherche organisées par l’IA, avec des titres générés mettant en évidence différents types de contenus. Cette fonctionnalité sera d’abord proposée pour les résultats concernant les repas et les recettes, puis pour les achats, les voyages et les divertissements.

Cet article a été publié dans le New York Times.

Lisez cet article dans sa version originale (en anglais ; abonnement requis)