#image_title

La cognition émerge de la furtivité pour lancer l’ingénieur logiciel d’IA Devin

Rejoignez les dirigeants à Boston le 27 mars pour une soirée exclusive de réseautage, d’idées et de conversation. Demandez une invitation ici.


Aujourd’hui, Cognition, une startup d’IA récemment créée soutenue par le Peter Thiels Founders Fund et des leaders de l’industrie technologique, dont l’ancien cadre de Twitter Elad Gil et le co-fondateur de Doordash Tony Xu, a annoncé la création d’un ingénieur logiciel d’IA entièrement autonome appelé Devin.

Bien qu’il existe plusieurs assistants de codage, dont le célèbre Github Copilot, Devin se démarquerait du lot par sa capacité à gérer des projets de développement entiers de bout en bout, depuis l’écriture du code et la correction des bugs qui y sont associés. à l’exécution finale. Il s’agit de la première offre de ce type et même capable de gérer des projets sur Upwork, a démontré la startup.

L’annonce de Devin marque un changement important dans le domaine du développement assisté par l’IA, offrant aux ingénieurs un travailleur de l’IA à part entière pour leurs projets, plutôt qu’un copilote qui pourrait simplement écrire du code simple ou suggérer des extraits.

Cependant, pour l’instant, Devin reste non public, la société n’ouvrant l’accès qu’à quelques clients sélectionnés, dont la journaliste de Bloomberg Ashlee Vance, qui a écrit ici sur son expérience d’utilisation.

Événement VB

L’AI Impact Tour de Boston

Nous sommes ravis de la prochaine étape du AI Impact Tour à Boston le 27 mars. Cet événement exclusif sur invitation uniquement, en partenariat avec Microsoft, proposera des discussions sur les meilleures pratiques en matière d’intégrité des données en 2024 et au-delà. Les places sont limitées, alors demandez une invitation dès aujourd’hui.

Demandez une invitation

Que peut faire exactement Devin ?

Dans un article de blog publié aujourd’hui sur le site Web de Cognitions, Scott Wu, fondateur et PDG de Cognition et codeur sportif primé, a expliqué que Devin peut accéder à des outils de développement courants, notamment son propre shell, son éditeur de code et son navigateur, dans un environnement informatique en bac à sable pour planifier et exécuter des tâches d’ingénierie complexes nécessitant des milliers de décisions.

L’utilisateur humain tape simplement une invite en langage naturel dans l’interface de style chatbot de Devins, et l’ingénieur logiciel d’IA s’en sert à partir de là, développant un plan détaillé, étape par étape, pour résoudre le problème. Il commence ensuite le projet en utilisant ses outils de développement, tout comme la façon dont un humain les utiliserait, en écrivant son propre code, en résolvant les problèmes, en testant et en rendant compte de sa progression en temps réel, permettant à l’utilisateur de garder un œil sur tout pendant son fonctionnement. .

Si quelque chose ne semble pas correct à l’observateur humain, l’utilisateur peut également accéder à l’interface de discussion et donner à l’IA une commande pour le corriger. Selon Cognition, cela permet aux équipes d’ingénierie de déléguer certains de leurs projets à l’IA et de se concentrer sur des tâches plus créatives nécessitant l’intelligence humaine.

Devin propose ainsi un nouveau paradigme qui pourrait être un aperçu de la manière dont tout le développement logiciel et le travail informatique pourront être effectués dans un avenir proche : par des travailleurs de l’IA supervisés par des superviseurs/utilisateurs humains.

Capable de gérer un large éventail de tâches de développement

Selon les démos partagées par Wu, Devin est capable de gérer une gamme de tâches dans sa forme actuelle. Cela inclut des projets d’ingénierie courants tels que le déploiement et l’amélioration d’applications/sites Web de bout en bout et la recherche et la correction de bogues dans les bases de code, ainsi que des tâches plus complexes telles que la configuration d’un grand modèle de langage à l’aide du lien vers un référentiel de recherche sur GitHub ou l’apprentissage. comment utiliser des technologies inconnues.

Dans un cas, il a appris grâce à un article de blog comment exécuter le code pour produire des images avec des messages cachés. Pendant ce temps, dans un autre, il a géré un projet Upwork pour exécuter un modèle de vision par ordinateur en écrivant et en déboguant le code correspondant.

Dans le test SWE-bench, qui teste les assistants IA avec des problèmes GitHub issus de projets open source réels, l’ingénieur logiciel IA a été capable de résoudre correctement 13,86 % des cas de bout en bout sans aucune aide humaine. En comparaison, Claude 2 ne pourrait résoudre que 4,80 % tandis que SWE-Llama-13b et GPT-4 pourraient traiter respectivement 3,97 % et 1,74 % des problèmes. Tous ces modèles avaient même besoin d’une assistance, où on leur disait quel fichier devait être corrigé.

Performance de Devin dans le test sur banc SWE

La technologie de base reste non décrite

L’IA dans le développement de logiciels n’est pas une nouveauté. Il existe des outils dans cet espace depuis un certain temps, depuis les populaires GitHub Copilot et StarCoder jusqu’à Replit, qui propose quelques petits modèles de codage d’IA sur Hugging Face, et Codeium, qui a récemment obtenu un financement de série B de 65 millions de dollars pour une valorisation de 65 millions de dollars. 500 millions de dollars.

Cependant, la plupart de ces offres se sont largement concentrées sur l’utilisation de l’IA pour faciliter le codage. Ils peuvent générer du code simple à partir d’invites de texte, le résumer avec le contexte IDE pertinent ou récupérer des extraits, accélérant ainsi le flux de travail de l’équipe. Avec Devin, Cognition AI semble aller plus loin (ou plusieurs étapes), en donnant à un travailleur de l’IA à part entière la possibilité de gérer des projets entiers.

Bien que l’outil reste à tester, sa capacité à gérer plusieurs étapes tout en restant sur la bonne voie pour mener à bien un projet d’ingénierie logicielle est le principal argument de vente unique. Cognition n’a pas expliqué comment exactement elle a réalisé cet exploit et si elle utilise son propre modèle exclusif ou celui d’un tiers, mais elle note que le travail est le résultat de ses progrès en matière de raisonnement et de planification à long terme.

Actuellement, la société est en train d’augmenter sa capacité et d’offrir un accès anticipé à Devin uniquement à certains utilisateurs. Il indique que les parties intéressées souhaitant accroître leurs travaux d’ingénierie peuvent nous contacter par courrier électronique pour y accéder. Un accès plus large devrait s’ouvrir ultérieurement.

Cognition note également sur son site Web que le codage n’est qu’un début, ce qui semble indiquer qu’elle pourrait exploiter ses avancées en matière de raisonnement pour lancer des agents/travailleurs d’IA similaires dans d’autres disciplines également. L’entreprise a reçu jusqu’à présent un financement de 21 millions de dollars.

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie et les transactions d’entreprise transformatrices. Découvrez nos Briefings.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite