Avec « GitHub for data », Gable.ai veut connecter les ingénieurs logiciels et les développeurs ML

Rendez-vous sur notre bibliothèque à la demande pour visualiser les sessions de VB Transform 2023. Inscrivez-vous ici


Les applications de l’IA sont en plein essor. Mais pour éviter qu’elles ne se brisent, les données circulant dans ces applications doivent être de haute qualité, c’est-à-dire fiables, complètes et précises.

C’est le problème que Gable.ai est sur le point de résoudre alors que la startup basée à Seattle se lance aujourd’hui furtivement avec 7 millions de dollars de financement de démarrage. Il appelle son offre la première plate-forme de collaboration de données qui permet aux développeurs de logiciels et de données/ML de créer et de gérer de manière itérative des actifs de données de haute qualité, mais les investisseurs ont pris l’habitude de l’appeler GitHub pour désigner les données dans lesquelles d’autres sociétés de données comme Kaggle et Hex investissent. dans.

GitHub affecte réellement la culture en aidant les ingénieurs logiciels de toute l’entreprise à communiquer entre eux beaucoup plus efficacement, a déclaré Chad Sanderson, PDG et co-fondateur de Gable.ai. Mais cela n’existe pas du tout pour les données.

La plateforme Gable.ais permet aux producteurs et aux consommateurs de données de travailler ensemble, a-t-il déclaré à VentureBeat. Il aide les développeurs de logiciels et de données à éviter les modifications brutales des flux de travail de données critiques au sein de leur infrastructure de données existante. La plateforme propose la reconnaissance des actifs de données en connectant des sources de données ; création de contrats de données pour établir les propriétaires des actifs de données et définir des contraintes significatives ; et l’application des contrats de données via une intégration continue/un déploiement continu au sein de GitHub.

Événement

VB Transform 2023 à la demande

Avez-vous manqué une session de VB Transform 2023 ? Inscrivez-vous pour accéder à la bibliothèque à la demande pour toutes nos sessions en vedette.

S’inscrire maintenant

Les fondateurs dirigeaient le département de données chez Convoy

Avant de fonder Gable.ai, Sanderson et ses co-fondateurs, Adrian Kreuziger et Daniel Dicker, dirigeaient le département de données de Convoy, le réseau de fret numérique de 4 milliards de dollars qui déplace chaque jour des milliers de camions à travers le pays via un réseau de transporteurs optimisé et connecté. . Des données complexes arrivaient rapidement et furieusement, concernant les expéditions, les expéditeurs, les installations, les transporteurs, les camions, les contrats et les prix.

Même si l’entreprise disposait d’une pile de données moderne, utilisant les technologies les plus récentes et les plus performantes, personne n’avait confiance dans les données. Il y avait des problèmes constants de qualité des données, des pannes pour des modèles précieux et des milliards de lignes de données ne pouvaient pas être utilisées.

Lorsque notre équipe de science des données et l’équipe d’analyse essayaient de comprendre même des questions simples telles que Combien d’expéditions avons-nous effectuées au cours des 30 derniers jours ?, toute cette complexité rendait presque impossible de répondre à cette question, a déclaré Sanderson. Et c’était le même problème dans l’apprentissage automatique : les modèles étaient très, très sensibles et le data scientist devait déterminer exactement quelles données de ce système très complexe devaient entrer dans ce modèle. Lorsque la qualité des données était mauvaise, lorsque quelque chose changeait soudainement, tous ces modèles sensibles commençaient à s’effondrer et toutes les prédictions qu’ils faisaient se révélaient fausses.

En fin de compte, a-t-il expliqué, le problème résidait dans le manque de communication entre les ingénieurs logiciels et les développeurs de ML. Une fois que nous avons contribué à combler cet écart, nous avons constaté une amélioration exponentielle de la qualité des données presque immédiatement, a-t-il déclaré.

Afin de faire évoluer l’IA, il est essentiel de résoudre les problèmes de communication liés aux modifications des données, a souligné Sanderson.

Si vous ne disposez pas d’un système de gestion des modifications pour vos données, vous ne pourrez tout simplement pas faire évoluer l’IA, ce que vous ne pouvez tout simplement pas faire, a-t-il expliqué. La façon dont les Google, les Metas et les Amazones ont résolu ce problème jette les corps sur le problème. Lorsqu’un nouveau modèle d’apprentissage automatique est expédié, il doit y avoir deux, trois ou quatre ingénieurs de données dans la salle. Mais dans une entreprise comme Convoy, a-t-il expliqué, nous n’avions pas la capacité de faire cela. Notre équipe d’ingénierie des données était composée de six personnes.

Une nouvelle partie de la pile de données

Les contrats de données Gable.ais sont une toute nouvelle catégorie que Gable.ai a pu établir en tant que primitive de données émergente, c’est-à-dire un type de données de base. Au cours des derniers mois, Sanderson a créé le Data Quality Camp, une communauté Slack de plus de 8 000 praticiens des données engagés autour de ces nouveaux concepts.

Ces concepts sont censés marquer une étape importante vers la refonte du paysage des données, devenant ainsi un nouvel élément de la pile de données d’une entreprise, a déclaré Apoorva Pandhi, directeur général de Zetta Venture Partners, qui a dirigé le cycle de financement.

Tous les fondateurs d’entreprises de données à succès, qu’il s’agisse de dbt Labs, Monte Carlo, Hex, Kaggle, Hightouch, Great Expectations, ont tous investi dans l’entreprise et ont approuvé le fait qu’elle fait partie intégrante de la pile de données, a-t-il déclaré.

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie et les transactions d’entreprise transformatrices. Découvrez nos Briefings.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite