J’ai été témoin de l’avenir de l’IA et c’est un jouet cassé
Cette histoire était censée avoir un début différent. Vous étiez censé entendre comment, plus tôt cette semaine, j’ai assisté à une soirée de lancement éclatante pour un nouveau gadget d’IA, le Rabbit R1, à New York, puis, debout sur un trottoir venteux à l’extérieur de la salle, j’ai appuyé sur un bouton de l’appareil pour invoquer un Uber à la maison. Au lieu de cela, après peut-être une heure de configuration et de manipulation, la connexion a échoué.
Le R1 est un appareil orange vif, avec une caméra, un micro et un petit écran. Appuyez et maintenez son bouton unique, posez-lui une question ou donnez-lui un ordre en utilisant votre voix, et le mignon lapin rebondissant à l’écran dressera ses oreilles, puis vous répondra. C’est théoriquement comme communiquer avec ChatGPT via un talkie-walkie. Vous pouvez lui demander d’identifier une fleur donnée grâce à son appareil photo ou de jouer une chanson basée sur des paroles à moitié mémorisées ; vous pouvez lui demander un Uber, mais il pourrait rester bloqué à la dernière marche et vous laisser bloqué dans le Queens.
Quand je suis finalement revenu à ma chambre d’hôtel, j’ai allumé la caméra du R1 et j’ai brandi une part de pizza froide. Qu’est-ce que je regarde ? J’ai demandé. Vous regardez une part de pizza, m’a dit la voix. (C’est vrai !) Il a l’air appétissant et fraîchement sorti du four. (Eh bien, non.) J’ai décidé d’essayer autre chose. Quels sont les top 10, j’ai trébuché en lâchant le bouton. J’ai réessayé : quels sont les 10 meilleurs cas d’utilisation de l’IA pour une personne normale ? L’appareil, peut-être confus par notre interaction précédente, a commencé à répertorier les garnitures de pizza en commençant par le numéro 2. 2. Saucisse. 3. Champignons. 4. Fromage supplémentaire.
Jusqu’à présent, l’IA grand public était largement définie par des logiciels : des chatbots tels que ChatGPT ou la correction automatique optimisée des iPhones. Nous vivons maintenant un chosification: Les entreprises lancent et fabriquent de véritables morceaux de métal et de plastique entièrement dédiés aux fonctionnalités de l’IA. Ces appareils se distinguent des gadgets d’IA précédents, tels que l’Amazon Echo, dans le sens où ils intègrent la technologie d’IA générative plus avancée, récemment en vogue, permettant aux utilisateurs des interactions plus naturelles. Il existe des épingles, des pendentifs et une toute nouvelle gamme de lunettes intelligentes.
Pourtant, malgré toutes ses promesses, cette nouvelle ère ne se déroule pas très bien. Prenez Humane, un concurrent de Rabbit qui a lancé une épingle AI portable plus tôt ce mois-ci. Cet appareil a été positionné comme un remplacement de smartphone, avec un prix correspondant : il coûte 699 $ et nécessite un abonnement mensuel de 24 $. Les critiques ont brutalisé l’épingle, affirmant qu’elle était lente, surchauffe et avait du mal à répondre aux requêtes de base. J’ai du mal à nommer une seule chose pour laquelle il est vraiment bon, Le bord a écrit.
En comparaison, la R1 est suffisamment petite dans son ambition et (relativement) abordable dans son prix (199 $, sans abonnement). L’appareil lui-même est amusant et rétro-chic : Jesse Lyu, fondateur et PDG de Rabbits, aurait acheté à chaque membre de son équipe un Tamagotchi pour s’en inspirer. Et, en toute honnêteté, la R1 fait des choses intéressantes. Sur scène, Lyu a montré comment l’appareil peut interpréter un tableau manuscrit et le convertir en une feuille de calcul numérique fonctionnelle. Il a réussi à résumer une page manuscrite lorsque je lui ai demandé, mais avec une précision d’environ 65 % seulement. J’ai pu utiliser le gadget pour commander un bol d’açai sur DoorDash, bien qu’il ne puisse gérer aucune personnalisation. (Je voulais du beurre de cacahuète.) Et je n’ai jamais fait travailler Uber. (Bien qu’à un moment donné, l’appareil m’a dit que la demande avait échoué alors qu’en fait ce n’était pas le cas, me laissant accroché pour un trajet de 9 $ que je n’ai même pas pris.)
L’un des principaux arguments de vente du R1 est qu’il est censé fonctionner avec ce qu’on appelle un grand action modèle, ou LAMa tourne sur la phrase grand modèle de langage, qui est la technologie qui alimente les chatbots récents. Alors que ChatGPT peut répondre à des questions et vous rédiger un essai médiocre, le R1 peut, en théorie, effectuer des actions que vous pourriez entreprendre sur différentes applications (Venmo-ing votre ami 20 $, par exemple). Rabbit a déclaré que l’appareil serait capable d’apprendre n’importe quelle application, si vous la lui apprenez. Lyu a comparé la technologie à une Tesla : lorsqu’elle est en pilote automatique, une voiture Tesla peut en théorie reconnaître un panneau d’arrêt non pas parce que les ingénieurs lui disent à quoi ressemble un panneau d’arrêt, mais parce qu’elle a été entraînée sur d’innombrables heures d’images pour reconnaître les attributs physiques des panneaux. De même, R1 pourra accomplir des tâches sur votre téléphone sans avoir à apprendre chaque application.
Le problème est que rien de tout cela n’est réellement réel. Au moins pas encore. Comme pour de nombreux produits d’IA, le R1 est davantage alimenté par un battage médiatique que par un cas d’utilisation convaincant. (Beaucoup de ses fonctions pourraient, après tout, être exécutées sur un smartphone.) En février, Lyu a déclaré que le Rabbit entraînait son modèle sur 800 applications. Cette semaine, il a été lancé avec la possibilité d’en utiliser seulement quatre : Spotify, DoorDash, Uber et Midjourney (un générateur d’art IA populaire). L’entreprise affirme que LAM en est à ses premiers stades.
Sur scène devant un public de journalistes et de fans de Rabbit mardi soir, Lyu semblait parfois nerveux, encourageant à un moment les gens à rire pour apaiser ses nerfs. Avant l’événement, un utilisateur avait publié sur GitHub accusant Rabbit de déformer sa technologie. Pour ceux qui ont une formation technique, il est malheureusement clair qu’il n’y a pas d’intelligence artificielle ou de grand modèle d’action en vue, lit-on dans le message anonyme, qui a depuis été supprimé. Sur X, Lyu a qualifié le message de fausses déclarations. Lyu a promis de corriger tous les bugs qui pourraient survenir sur les appareils R1. Avant de faire une démonstration de DoorDash sur scène, il a admis que la fonctionnalité ne fonctionnait pas encore aussi vite qu’ils le souhaiteraient : Mais je veux vous le montrer, et je veux être franc avec vous, les gars.
Pourtant, Lyu a également annoncé à bout de souffle un certain nombre de nouvelles initiatives, notamment un système de haut niveau qui permettrait aux gens de fusionner un jour le physique et le numérique, afin que les gens puissent pointer divers objets intelligents dans leur maison et les contrôler via l’IA de Rabbits. (Peu importe que le R1 ait été lancé sans bon nombre de ses fonctionnalités promises.) Vers la fin de la présentation, les mots Être humble est apparu sur l’écran géant derrière lui. Nous sommes une équipe vraiment très humble, a déclaré Lyu à la foule. Ces mots étaient encore affichés lorsque, quelques instants plus tard, les rideaux de chaque côté de la scène s’abaissaient de façon spectaculaire pour révéler des tapis roulants chargés de cartons de R1. La musique a commencé à retentir et les gens ont commencé à faire la queue pour récupérer le leur.
Le R1 rappelle le décalage, pour le meilleur et pour le pire, entre une culture de la Silicon Valley qui donne souvent la priorité à la vitesse plutôt qu’à la qualité et les attentes élevées des consommateurs concernant les produits qu’ils utilisent. Et pour être honnête, les attentes sont élevées, au moins en partie à cause des produits extraordinaires qui ont émergé de cette même culture compétitive et itérative au fil des ans.
Alors que la fête se terminait, la nouvelle du premier bug est arrivée : il n’y avait aucun moyen de changer le fuseau horaire sur les appareils, dont beaucoup étaient programmés par défaut sur la côte ouest. Il s’avère que l’avenir est coincé avec trois heures de retard.