Le marché des puces de pointe AI est en feu, alimenté par un financement « stupéfiant » de capital-risque | ZDNet
Les puces pour effectuer des inférences d’IA sur des appareils de pointe tels que les smartphones sont un marché brûlant, même des années après l’émergence du domaine, attirant de plus en plus de startups et de plus en plus de financements à risque, selon une importante société d’analyse de puces couvrant le domaine.
« Il y a de plus en plus de nouvelles startups qui continuent d’apparaître et qui continuent d’essayer de se différencier », déclare Mike Demler, analyste principal chez The Linley Group, qui publie le très lu Microprocessor Report, dans une interview avec ZDNet par téléphone.
Linley Group organise chaque année deux conférences dans la Silicon Valley accueillant de nombreuses startups, le Spring and Fall Processor Forum, en mettant l’accent ces dernières années sur ces startups d’IA.
Lors de l’événement le plus récent, qui s’est tenu en octobre, à la fois virtuellement et en personne, à Santa Clara, en Californie, la conférence était remplie de startups telles que EdgeCortix, Flex Logix, Hailo Technologies, Roviero, BrainChip, Syntiant, Untether AI, Expedera, et Deep AI donnant de courtes discussions sur leurs conceptions de puces.
Demler et son équipe assemblent régulièrement un rapport de recherche intitulé Guide des processeurs pour l’apprentissage en profondeur, dont la dernière version est attendue ce mois-ci. « Je compte plus de 60 vendeurs de puces dans cette dernière édition », a-t-il déclaré. ZDNet.
Edge AI est devenu un terme générique qui fait principalement référence à tout ce qui ne se trouve pas dans un centre de données, bien qu’il puisse inclure des serveurs en marge des centres de données. Cela va des smartphones aux appareils embarqués qui aspirent des micro-watts de puissance en utilisant le cadre TinyML pour l’IA mobile de Google.
La partie médiane de cette gamme, où les puces consomment de quelques watts de puissance jusqu’à 75 watts, est une partie particulièrement encombrée du marché, a déclaré Demler, généralement sous la forme d’une carte PCIe ou M.2 enfichable. (75 watts est la limite du bus PCI dans les appareils.)
« Les cartes PCIe sont le segment chaud du marché, pour l’IA pour l’industrie, pour la robotique, pour la surveillance du trafic », a-t-il expliqué. « Vous avez vu des entreprises telles que Blaize, FlexLogic – beaucoup de ces entreprises s’attaquent à ce segment. »
Mais la très faible puissance est également très active. « Je dirais que le segment tinyML est tout aussi chaud. Là, nous avons des puces allant de quelques milliwatts à même des microwatts. »
La plupart des appareils sont dédiés à l’étape « d’inférence » de l’IA, où l’intelligence artificielle fait des prédictions basées sur de nouvelles données.
L’inférence se produit après la formation d’un programme de réseau neuronal, ce qui signifie que ses paramètres réglables ont été suffisamment développés pour former des prédictions de manière fiable et que le programme peut être mis en service.
Le défi initial pour les startups, a déclaré Demler, est de passer d’un joli diaporama PowerPoint à du silicium fonctionnel. Beaucoup commencent par une simulation de leur puce fonctionnant sur un réseau de portes programmable sur le terrain, puis passent soit à la vente d’un système sur puce (SoC) fini, soit à une licence de leur conception en tant qu’IP synthétisable pouvant être intégrée dans le système d’un client. ébrécher.
« Nous voyons encore beaucoup de startups couvrir leurs paris, ou poursuivre autant de modèles de revenus que possible », a déclaré Demler, « en faisant d’abord une démonstration sur un FPGA et en offrant leur IP principale pour les licences ». Certaines startups proposent également la version basée sur FPGA en tant que produit. »
Avec des dizaines de fournisseurs sur le marché, même ceux qui se mettent au silicium fonctionnel sont mis au défi de montrer quelque chose de significativement différent.
« Il est difficile de proposer quelque chose de vraiment différent », a déclaré Demler. « Je vois ces présentations, ‘premières mondiales’ ou ‘meilleures au monde’, et je dis, oui, non, nous en avons vu des dizaines. »
Certaines entreprises ont commencé avec une approche tellement différente qu’elles se sont démarquées très tôt, mais ont mis du temps à porter leurs fruits.
BrainChip Holdings, de Sydney, en Australie, avec des bureaux à Laguna Hills, en Californie, a démarré très tôt en 2011 avec une puce pour gérer les réseaux de neurones à pointes, l’approche neuromorphique de l’IA qui prétend modéliser plus étroitement le fonctionnement du cerveau humain.
Au fil des ans, la société a montré comment sa technologie peut effectuer des tâches telles que l’utilisation de la vision artificielle pour identifier les jetons de poker sur le sol du casino.
« BrainChip poursuit obstinément cette architecture de pointe », a déclaré Demler. « Il a une capacité unique, il peut vraiment apprendre sur l’appareil », réalisant ainsi à la fois la formation et l’inférence.
BrainChip est en un sens la plus éloignée de toutes les startups : elle est cotée en bourse. Ses actions sont cotées à la Bourse australienne sous le symbole « BRN », et l’automne dernier, la société a émis des actions de dépôt américaines pour les négocier sur le marché américain de gré à gré, sous le symbole « BCHPY ». Ces actions ont depuis plus que triplé en valeur.
BrainChip commence tout juste à générer des revenus. La société a sorti en octobre des mini-cartes PCIe de son processeur « Akida », pour x86 et Raspberry Pi, et le mois dernier a annoncé de nouvelles cartes PCIe pour 499 $. La société a réalisé un chiffre d’affaires de 1,1 million de dollars au cours du trimestre de décembre, contre 100 000 dollars au trimestre précédent. Le chiffre d’affaires total pour l’année s’est élevé à 2,5 millions de dollars, avec une perte d’exploitation de 14 millions de dollars.
Certaines autres approches exotiques se sont avérées difficiles à mettre en pratique. La startup de puces Mythic, fondée en 2012 et basée à Austin, au Texas, a poursuivi la nouvelle voie consistant à faire en sorte que certains de ses circuits utilisent la technologie des puces analogiques, où au lieu de traiter des uns et des zéros, elle calcule via la manipulation d’une forme d’onde à valeur réelle d’un signal électrique.
« Mythic a généré quelques puces mais n’a annoncé aucun gain de conception dont nous ayons connaissance », a observé Demler. être beaucoup plus difficile. »
Une autre startup présentant à la Processor Conference, Syntiant, a commencé avec une approche analogique, mais a décidé que l’analogique n’offrait pas suffisamment d’avantages en termes de puissance et prenait plus de temps à mettre sur le marché, a noté Demler.
Syntiant d’Irvine, en Californie, fondée en 2017, s’est concentrée sur la reconnaissance d’objets très simple qui peut fonctionner avec une faible puissance sur rien de plus qu’un téléphone polyvalent ou un appareil auditif.
« Sur un téléphone polyvalent, vous ne voulez pas de processeur d’applications, donc la solution Syntiant est parfaite », a observé Demler.
Indépendamment du succès d’une startup, l’utilité de circuits spéciaux signifie que l’accélération de l’IA perdurera en tant que catégorie de technologie de puce, a déclaré Demler.
« L’IA devient si omniprésente dans tant de domaines, y compris l’automobile, le traitement embarqué, l’IoT, le mobile, les PC, le cloud, etc., que l’inclusion d’un accélérateur à usage spécial deviendra monnaie courante, tout comme les GPU le sont pour les graphiques. »
Néanmoins, certaines tâches seront plus efficaces pour s’exécuter sur un processeur, un DSP ou un GPU à usage général, a déclaré Demler. C’est pourquoi Intel et Nvidia et d’autres amplifient leurs architectures avec des instructions spéciales, comme pour la gestion des vecteurs.
Différentes approches continueront d’être explorées tant qu’un marché du capital-risque inondé de liquidités laissera fleurir mille fleurs.
« Il y a encore tellement d’argent de capital-risque là-bas, je suis étonné par le montant que ces entreprises continuent d’obtenir », a déclaré Demler.
Demler note des rondes de financement géantes pour Sima.ai de San Jose, en Californie, fondée en 2018, qui développe ce qu’elle appelle un « MLSoC » axé sur la réduction de la consommation d’énergie. La société a reçu 80 millions de dollars lors de son cycle de financement de série B.
Un autre est Hailo Technologies de Tel Aviv, fondé en 2017, qui a levé 320,5 millions de dollars, selon FactSet, dont 100 millions de dollars lors de son dernier tour, et est censé être évalué à un milliard de dollars.
« Les chiffres en provenance de Chine, s’ils sont vrais, sont encore plus stupéfiants », a déclaré Demler. Le financement devrait se poursuivre pour le moment, a-t-il déclaré. « Jusqu’à ce que la communauté du capital-risque décide qu’il y a autre chose dans lequel investir, vous allez voir ces entreprises surgir partout. »
À un moment donné, une secousse se produira, mais on ne sait pas quand ce jour arrivera.
« Certains d’entre eux doivent finir par s’en aller », a déclaré Demler. « Que ce soit dans 3 ou 5 ans, nous verrons beaucoup moins d’entreprises dans cet espace. »
Le prochain événement de conférence que Demler et ses collègues organiseront fin avril, le Spring Processor Forum, à l’hôtel Hyatt Regency de Santa Clara, mais avec une diffusion en direct pour ceux qui ne peuvent pas se rendre en personne.