Nvidia veut réécrire la pile de développement logiciel
Le PDG de Nvidia, Jensen Huang, a semé la consternation en déclarant récemment que les gens n’auraient pas besoin d’apprendre à programmer grâce aux progrès de l’IA.
L’IA peut générer du code pour résoudre des problèmes spécifiques ; c’est déjà prouvé. Mais à un niveau fondamental, Nvidia repense la pile logicielle sous-jacente qui aide l’IA à générer le code dont les humains ont besoin.
L’idée de Huang : pendant des décennies, le monde a été pris en otage par l’informatique conventionnelle autour des processeurs, dans laquelle les humains écrivaient des applications pour récupérer des informations préparées dans des bases de données.
« De la façon dont nous utilisons l’informatique aujourd’hui, les informations ont été écrites par quelqu’un, créées par quelqu’un, elles sont essentiellement préenregistrées », a déclaré Huang lors d’une séance assise la semaine dernière à l’Université de Stanford.
Les GPU de Nvidia ont ouvert la voie du calcul accéléré vers un style informatique plus algorithmique, dans lequel le raisonnement créatif – et non la logique – aide à déterminer les résultats.
« Pourquoi programmer en Python ? À l’avenir, vous direz à l’ordinateur ce que vous voulez », a déclaré Huang.
Programmation dans le futur
Les experts prédisent que, dans cinq ans, les informations sous forme de texte, d’images, de vidéo et de voix seront toutes transmises en temps réel aux grands modèles linguistiques (LLM). L’ordinateur s’améliorera continuellement à partir de tous les flux d’informations et interactions multimodales.
« À l’avenir, nous aurons un apprentissage continu. Nous pourrions décider si ce résultat de l’apprentissage continu sera déployé », a déclaré Huang. « La façon dont vous interagissez avec l’ordinateur ne sera pas C++ », a déclaré Huang.
C’est là qu’intervient l’IA : les gens raisonnent et demandent aux ordinateurs de générer du code pour atteindre des objectifs spécifiques. Cela nécessitera que les gens parlent aux ordinateurs en langage simple, et non en C++ ou Python.
« Ce que je veux dire, c’est que la programmation a changé d’une manière qui a probablement perdu de sa valeur », a déclaré Huang, ajoutant que l’IA a comblé la fracture technologique de l’humanité.
« Aujourd’hui, environ 10 millions de personnes ont un emploi rémunéré parce que nous savons programmer des ordinateurs, ce qui laisse les 8 milliards restants de côté. Ce n’est pas vrai à l’avenir », a déclaré Huang.
L’anglais est le nouveau langage de programmation
Huang a déclaré que la langue anglaise sera le langage de programmation le plus puissant et que l’interaction à l’échelle humaine est un ingrédient clé pour combler le fossé technologique.
L’IA générative ressemblera davantage à un système d’exploitation, et les humains pourront dire aux ordinateurs en langage simple de créer des applications. Les grands modèles linguistiques (LLM) aideront les humains à transmettre leurs idées via des ordinateurs, a déclaré Huang.
Par exemple, les humains sont déjà capables de demander aux LLM de générer du code Python pour des applications de domaine spécifiques, et le tout dans un anglais simple.
« Comment faire en sorte qu’un ordinateur fasse ce que vous voulez qu’il fasse ? Comment affiner les instructions avec cet ordinateur ? C’est ce qu’on appelle l’ingénierie rapide. Il y a du talent artistique là-dedans », a déclaré Huang.
Les gens peuvent se concentrer sur les connaissances et l’expertise du domaine, et l’IA générative comblera le manque de programmation. Cela aura un impact sur le paysage du développement logiciel, a déclaré Huang.
Huang a déjà comparé les LLM à des diplômés universitaires pré-formés pour être super intelligents. Nvidia entoure de grands modèles dotés de connaissances spécialisées dans des domaines tels que les soins de santé et la finance, qui pourraient soutenir les entreprises.
Il existe environ 1 000 milliards de dollars de centres de données, qui vont plus que doubler au cours des quatre à cinq prochaines années pour atteindre 4 000 à 5 000 milliards de dollars, a déclaré Huang. Les GPU de Nvidia touchent presque toutes les installations et applications d’IA.
Ne rejetez pas le PDG de Nvidia
Les pronostics de Huang dans le passé ont porté leurs fruits. On lui attribue le mérite d’être un pionnier de l’IA : il a dirigé l’ingénierie des GPU Nvidia afin que les théories de l’IA vieilles de plusieurs décennies puissent être mises en pratique.
La mainmise de Nvidia sur le marché de l’IA a poussé la valorisation de l’entreprise à environ 2 000 milliards de dollars, et l’entreprise est prête à vivre une année historique après une année 2024 révolutionnaire.
Les ventes de GPU ont propulsé le chiffre d’affaires de l’entreprise à 22,1 milliards de dollars pour le quatrième trimestre, soit une augmentation stupéfiante de 265 % par rapport au même trimestre de l’année dernière. Les revenus pour 2024 ont augmenté de 126 % pour atteindre 60,9 milliards de dollars par rapport à 2023.
Au début des années 2000, Nvidia vendait des GPU pour les jeux. Huang s’est rendu compte que les unités de traitement vectoriel pouvaient être utilisées pour des modélisations et des simulations plus vastes nécessaires au calcul scientifique. Il a créé la pile logicielle CUDA en 2007 pour le calcul accéléré, et elle constitue désormais un ingrédient central de la domination de Nvidia en matière d’IA.
Approche de développement d’applications Nvidia
L’IA permet aux utilisateurs de parler avec différents types de données sous forme de texte, d’images et de voix. Les différents types de données nécessitent une nouvelle pile logicielle et des accélérateurs tels que les GPU pour fonctionner raisonnablement bien.
Le logiciel CUDA GPU Drrver de NVidia fournit la base des outils nécessaires pour communiquer avec le GPU. Il comprend un modèle de programmation, des outils de développement et un large éventail de bibliothèques. Les développeurs d’IA utilisent les primitives CUDA pour exploiter les capacités du GPU Nvidia.
CUDA dispose également d’outils qui automatisent le codage permettant aux utilisateurs d’exécuter des applications sur des GPU. Nvidia crée des traducteurs universels capables de répondre aux requêtes, d’exécuter quelques lignes de code Python et de les transmettre aux modèles d’IA sélectionnés.
Le CUDA de Nvidia désassemble les modèles de développement logiciel traditionnels dans lesquels les applications étaient écrites pour les processeurs. Le paysage de l’IA présente de nouveaux types de données, d’algorithmes et de moteurs de calcul, et le GPU remplace le CPU, mal équipé pour gérer des problèmes complexes.
Mais il existe des similitudes entre la pile IA de Nvidia et les plates-formes dites x86 Wintel. Si une IA a été formée sur un GPU Nvidia, elle nécessitera également principalement du matériel Nvidia pour l’inférence. Mais cela pourrait changer à mesure que des sociétés d’IA comme Microsoft et Meta commenceront à déployer leur propre matériel d’IA.
La structure de Nvidia s’aligne
La structure commerciale de Nvidia reflète la manière dont elle attend de l’IA qu’elle complète l’interaction humaine avec les ordinateurs : par les types de données et la connaissance du domaine.
La société dispose d’outils CUDA prédéfinis pour fonctionner avec tous les types de modèles. Par exemple, elle possède une activité automobile qui comprend tous les composants matériels et logiciels nécessaires aux entreprises pour construire des voitures autonomes. Son activité de santé aide les médecins à utiliser l’IA pour interagir avec les données médicales en fusionnant les images, les rapports des patients et les entrées vocales.
Nvidia appelle sa suite AI Enterprise le « système d’exploitation IA ». Le logiciel comprend des LLM comme NeMo, des compilateurs, des bibliothèques et des piles de développement. Mais les entreprises auront besoin des GPU de Nvidia.
La pile est remplie d’étapes intermédiaires supplémentaires qui résolvent certains des problèmes épineux de l’IA. Par exemple, un outil appelé Guardrails peut analyser les résultats du LLM pour prévenir les discours de haine et maintenir les conversations sur la bonne voie. Cela dépend des règles établies par le propriétaire. Ces applications peuvent être développées à l’aide du framework LangChain.
L’objectif principal de Nvidia avec sa pile est de se débarrasser complètement de la ligne de commande et de fournir des techniques d’invite interactives pour interagir avec les bases de données. Cela n’a pas grand-chose à voir avec la pile logicielle, mais cela joue un rôle dans la manière dont la recherche évolue pour fournir des informations plus pertinentes – quoi, comment, quand et pourquoi – aux utilisateurs.
Huang vend des forfaits d’abonnement pour ses logiciels d’IA alors que la société passe à une stratégie de vente de logiciels et de matériel, un renversement complet de sa stratégie passée de vente de matériel et de logiciels. Nvidia espère vendre davantage de logiciels fonctionnant uniquement sur ses GPU.
Impact sur les développeurs
Huang a déclaré que des programmeurs seront toujours nécessaires pour son framework CUDA et pour les applications informatiques à usage général qui n’ont pas besoin de GPU.
Mais son message était clair : l’avenir, c’est l’IA, et les développeurs doivent rapidement adapter leurs compétences à l’évolution du paysage.
Nvidia a mis au point le concept d’une usine d’IA, qui ingère les données comme matières premières et recrache les données traitées comme produit final. Nvidia a établi des partenariats solides avec tous les fournisseurs de cloud et fournisseurs de logiciels tels que Google, Snowflake, Salesforce, Oracle et VMware.
Nvidia est un loup solitaire qui tente de changer la pile logicielle avec sa plate-forme matérielle et logicielle propriétaire. Mais les concurrents rattrapent rapidement leur retard : le ROCm d’AMD et le OneAPI d’Intel sont des options open source qui gagnent du terrain. Google développe sa propre pile logicielle et matérielle pour alimenter son infrastructure d’IA.
La prochaine conférence des développeurs de Nvidia, GTC, aura lieu plus tard ce mois-ci. Il existe des séminaires de base sur la façon d’écrire des programmes CUDA, des sessions sur les implémentations d’IA d’entreprises comme X (anciennement Twitter) et des discussions sur les opportunités pour les développeurs en IA.
Le discours d’ouverture de Huang ouvrira le spectacle.
YOUTUBE.COM/THENEWSTACK
La technologie évolue vite, ne manquez aucun épisode. Abonnez-vous à notre chaîne YouTube pour diffuser tous nos podcasts, interviews, démos et bien plus encore.
S’ABONNER