#image_title

Gemini 1.5 est le modèle d’IA de nouvelle génération de Google et il est déjà presque prêt

À peine deux mois après le lancement de Gemini, le grand modèle de langage que Google espère le propulser au sommet de l’industrie de l’IA, la société annonce déjà son successeur. Google lance aujourd’hui Gemini 1.5 et le met à la disposition des développeurs et des utilisateurs professionnels avant un déploiement complet auprès des consommateurs. La société a clairement indiqué qu’elle mise entièrement sur Gemini en tant qu’outil commercial, assistant personnel et tout le reste, et qu’elle s’efforce de mettre en œuvre ce plan.

Il y a beaucoup d’améliorations dans Gemini 1.5 : Gemini 1.5 Pro, le modèle à usage général du système de Google, est apparemment à égalité avec le Gemini Ultra haut de gamme que la société a récemment lancé, et il a battu Gemini 1.0 Pro à 87 %. de tests de référence. Il a été réalisé à l’aide d’une technique de plus en plus courante connue sous le nom de Mixture of Experts, ou MoE, ce qui signifie qu’il n’exécute qu’une partie du modèle global lorsque vous envoyez une requête, plutôt que de traiter l’intégralité du modèle tout le temps. (Voici une bonne explication sur le sujet.) Cette approche devrait rendre le modèle à la fois plus rapide à utiliser et plus efficace à exécuter par Google.

Mais il y a une nouveauté dans Gemini 1.5 qui enthousiasme toute l’entreprise, à commencer par le PDG Sundar Pichai : Gemini 1.5 a une énorme fenêtre contextuelle, ce qui signifie qu’il peut gérer des requêtes beaucoup plus volumineuses et examiner beaucoup plus d’informations à la fois. Cette fenêtre représente un énorme million de jetons, contre 128 000 pour OpenAI GPT-4 et 32 ​​000 pour l’actuel Gemini Pro. Les jetons sont une mesure délicate à comprendre (voici une bonne ventilation), donc Pichai simplifie les choses : il s’agit d’environ 10 ou 11 heures de vidéo, des dizaines de milliers de lignes de code. La fenêtre contextuelle signifie que vous pouvez interroger le robot IA sur tout ce contenu en même temps.

(Pichai dit également que les chercheurs de Google testent une fenêtre contextuelle de 10 millions de jetons qui représente, comme toute la série de Game of Thrones tout à la fois.)

Pendant qu’il m’explique cela, Pichai note avec désinvolture que l’on peut adapter l’ensemble du Le Seigneur des Anneaux trilogie dans cette fenêtre contextuelle. Cela semble trop précis, alors je lui demande : c’est déjà arrivé, n’est-ce pas ? Quelqu’un chez Google vérifie simplement si Gemini détecte des erreurs de continuité, essaie de comprendre la lignée complexe de la Terre du Milieu et voit si l’IA peut enfin donner un sens à Tom Bombadil. Je suis sûr que c’est arrivé, dit Pichai en riant, ou cela arrivera l’un des deux.

Pichai pense également que la fenêtre contextuelle plus large sera extrêmement utile pour les entreprises. Cela permet des cas d’utilisation dans lesquels vous pouvez ajouter beaucoup de contexte et d’informations personnelles au moment de la requête, dit-il. Pensez-y car nous avons considérablement élargi la fenêtre de requête. Il imagine que les cinéastes pourraient mettre en ligne l’intégralité de leur film et demander à Gemini ce que les critiques pourraient dire ; il voit des entreprises utiliser Gemini pour examiner des masses de dossiers financiers. Je considère cela comme l’une des plus grandes avancées que nous ayons réalisées, dit-il.

Pour l’instant, Gemini 1.5 ne sera disponible que pour les utilisateurs professionnels et les développeurs, via Vertex AI et AI Studio de Google. À terme, il remplacera Gemini 1.0, et la version standard de Gemini Pro, celle accessible à tous sur gemini.google.com et dans les applications de l’entreprise, sera la 1.5 Pro avec une fenêtre contextuelle de 128 000 jetons. Vous devrez payer un supplément pour atteindre le million. Google teste également la sécurité et les limites éthiques des modèles, en particulier en ce qui concerne la fenêtre contextuelle nouvellement plus grande.

Google est actuellement engagé dans une course effrénée pour créer le meilleur outil d’IA, alors que les entreprises du monde entier tentent de déterminer leur propre stratégie d’IA et de savoir si elles doivent signer leurs accords de développement avec OpenAI, Google ou quelqu’un d’autre. Cette semaine encore, OpenAI a annoncé une mémoire pour ChatGPT, et il semble se préparer à se lancer dans la recherche sur le Web. Jusqu’à présent, Gemini semble impressionnant, en particulier pour ceux qui font déjà partie de l’écosystème de Google, mais il reste beaucoup de travail à faire de tous les côtés.

En fin de compte, me dit Pichai, tous ces 1.0 et 1.5, ces pros, ces ultras et ces batailles d’entreprise n’auront pas vraiment d’importance pour les utilisateurs. Les gens vont simplement consommer les expériences, dit-il. C’est comme utiliser un smartphone sans toujours prêter attention au processeur situé en dessous. Mais à ce moment-là, dit-il, nous sommes encore dans la phase où tout le monde connaît la puce à l’intérieur de son téléphone, parce que c’est important. La technologie sous-jacente évolue très rapidement, dit-il. Les gens s’en soucient.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite