Des étudiants de Harvard ont levé 120 millions de dollars pour s’attaquer aux puces d’IA de Nvidia
Co-fondateurs de Etched, Robert Wachen, Gavin Uberti et Chris Zhu
Gravée
Basée à Cupertino, en Californie, Apple Etched développe une puce appelée Sohu, qui, selon la société, sera utilisée pour former et déployer des modèles d’IA à l’aide de « transformateurs », l’architecture de base qui sous-tend des avancées telles que ChatGPT d’OpenAI.
Gavin Uberti, cofondateur et PDG de l’entreprise, a déclaré qu’à mesure que l’IA se développe, la plupart des besoins en puissance de calcul de cette technologie seront satisfaits par des puces personnalisées et câblées, appelées ASIC. Leur efficacité réside dans le fait qu’elles n’exécutent que le modèle d’IA pour lequel elles ont été conçues, contrairement aux unités de traitement graphique (GPU) à usage général de Nvidia, qui sont plus performantes mais également beaucoup plus coûteuses.
« Nous faisons le plus gros pari sur l’IA », a déclaré Uberti dans une interview. « Si les transformateurs disparaissent, nous mourrons. Mais s’ils restent, nous sommes la plus grande entreprise de tous les temps. »
Uberti et ses cofondateurs sont conscients qu’il s’agit d’un pari à haut risque et qu’ils se retrouvent face à certaines des entreprises les plus capitalisées et les plus compétitives de la planète. Même si 120 millions de dollars représentent une somme considérable à collecter dans une série A, cela représente à peu près le montant de revenus généré par Nvidia en une demi-journée. Les ventes de Nvidia ont plus que triplé chaque année pendant trois trimestres consécutifs, dépassant 26 milliards de dollars au cours de la dernière période.
Nvidia détient plus de 80 % de part de marché des puces IA, selon les estimations. Etched fait partie d’un groupe de startups qui attirent des capitaux pour saisir cette opportunité naissante. Primary Venture Partners et Positive Sum Ventures ont mené le tour. Peter Thiel, Stanley Druckenmiller et le fondateur de Cruise, Kyle Vogt, sont également des soutiens.
Malgré l’avance de Nvidia et ce que certains développeurs décrivent comme un fossé, les nouveaux fabricants de puces avancent quand même, principalement parce que l’opportunité est si grande. Parmi les autres startups de puces qui s’attaquent à Nvidia, citons Cerebras Systems, qui construit une puce d’IA physiquement plus grande, et Tenstorrent, qui utilise une technologie à la mode appelée RISC-V pour construire des puces d’IA.
« La raison pour laquelle nous étions si enthousiastes à propos de ce que nous faisions, la raison pour laquelle nous avons abandonné l’école et avons convaincu tant de personnes d’abandonner ces projets de puces, c’est que c’est la chose la plus importante sur laquelle nous devons travailler », a déclaré Robert Wachen, directeur opérationnel d’Etched. « L’avenir de la technologie tout entier va être façonné par la capacité de l’infrastructure à gérer l’échelle. »
Les semi-conducteurs sont traditionnellement l’un des secteurs les plus difficiles pour les startups, étant donné les longs cycles de développement, le capital important requis pour construire une puce et la nécessité de s’engager avec un nombre limité de partenaires de fabrication, tels que Taiwan Semiconductor Manufacturing Co., qui construit le projet Etched. ébrécher.
Les investisseurs en capital-risque ont investi 6 milliards de dollars dans des sociétés de semi-conducteurs d’IA en 2023, soit une légère hausse par rapport aux 5,7 milliards de dollars de 2022, selon les données de PitchBook.
Uberti et Chris Zhu ont commencé à travailler dans une entreprise de puces après qu’Uberti ait effectué un stage d’été sur les compilateurs. Cela l’a mis en contact avec les idées de matériel de bas niveau qui ont conduit à Etched.
Le couple a abandonné Harvard en 2022 et a embauché le colocataire d’Uberti à l’université, Wachen. Ils ont rapidement commencé à embaucher des vétérans de l’industrie des puces électroniques. L’entreprise s’est installée à Cupertino et compte aujourd’hui 35 employés. Elle offre des allocations de logement aux nouveaux embauchés.
« Lorsque ChatGPT est sorti et que le stock de Nvidia a explosé, et surtout lorsque tous les autres modèles qui sortiraient seraient également des transformateurs, nous nous sommes retrouvés au bon endroit au bon moment », a déclaré Uberti.
Etched se prépare à commercialiser Sohu, et les fondateurs affirment qu’ils seront prêts à présenter quelque chose plus tard cette année. La startup s’efforce également de fidéliser ses clients et affirme que les entreprises technologiques sont impatientes de découvrir de nouvelles puces d’intelligence artificielle.
Pour que l’entreprise fonctionne, les entreprises qui dépensent des milliards de dollars en GPU devront réaliser des économies significatives en créant des puces personnalisées conçues pour leur modèle d’IA spécifique et être prêtes à faire des compromis en matière de flexibilité.
En se spécialisant dans les transformateurs, qui déplacent les données de manière prévisible de la puce vers la mémoire, la puce Sohu d’Etched peut consacrer moins d’espace à la mémoire et plus aux types de transistors qui définissent la puissance de calcul brute d’une puce, a déclaré Uberti.
Un autre aspect de l’efficacité d’Eteched est que la puce possède un grand cœur. Cela se traduit par moins de calculs inefficaces effectués par une partie appelée multiprocesseur de streaming pour coordonner les calculs par différents cœurs.
Uberti affirme que l’impact des puces d’IA spécialisées pourrait être similaire à la façon dont les puces personnalisées appelées ASIC, introduites pour la première fois en 2013 spécifiquement pour l’extraction de bitcoins ou d’éther, ont réduit la demande de GPU Nvidia.
Les fondateurs d’Etched s’attendent à ce que le besoin de puces pour exécuter ces modèles augmente, en particulier une fois qu’elles seront utilisées pour servir des millions de fois par minute à des logiciels d’IA.
Ils affirment également qu’en codant en dur l’architecture de l’IA dans la puce, leur appareil peut réduire la latence de retour des réponses, ce qui ouvre la voie à de nouveaux cas d’utilisation, tels que les agents IA ou les conversations vocales en temps réel. Etched affirme que ses puces sont plus de 10 fois plus rapides que les GPU de Nvidia, grâce à son architecture plus simple et à son cas d’utilisation unique.
Mais Etched s’attaque à certaines des entreprises les plus valorisées au monde, notamment Nvidia, qui disposent d’équipes de développement massives et d’un accès au capital nécessaire pour sécuriser la production et améliorer leurs puces sur une base annuelle.
Etched, qui dispose d’un compte à rebours affiché dans son siège, doit aller plus vite.
« La façon dont nous allons gagner ce marché spécialisé des puces d’IA, et ceux qui suivront, est d’être le premier produit à être commercialisé », a déclaré Uberti.