10 bases de données prenant en charge l’apprentissage automatique dans la base de données

Dans mon article d’octobre 2022, Comment choisir une plateforme d’apprentissage automatique dans le cloud, ma première ligne directrice pour choisir une plateforme était : Soyez proche de vos données. Garder le code près des données est nécessaire pour maintenir la latence faible, car la vitesse de la lumière limite les vitesses de transmission. Après tout, l’apprentissage automatique, en particulier l’apprentissage en profondeur, a tendance à parcourir toutes vos données plusieurs fois (chaque fois s’appelle une époque).

Le cas idéal pour les ensembles de données très volumineux consiste à créer le modèle là où les données résident déjà, de sorte qu’aucune transmission de données en masse ne soit nécessaire. Plusieurs bases de données le supportent dans une mesure limitée. La prochaine question naturelle est de savoir quelles bases de données prennent en charge l’apprentissage automatique interne et comment le font-elles ? Je vais discuter de ces bases de données par ordre alphabétique.

Redshift d’Amazon

Amazon Redshift est un service d’entrepôt de données géré à l’échelle du pétaoctet conçu pour simplifier et rentabiliser l’analyse de toutes vos données à l’aide de vos outils d’informatique décisionnelle existants. Il est optimisé pour des ensembles de données allant de quelques centaines de gigaoctets à un pétaoctet ou plus et coûte moins de 1 000 $ par téraoctet par an.

Amazon Redshift ML est conçu pour permettre aux utilisateurs SQL de créer, former et déployer facilement des modèles d’apprentissage automatique à l’aide de commandes SQL. La commande CREATE MODEL dans Redshift SQL définit les données à utiliser pour la formation et la colonne cible, puis transmet les données à Amazon SageMaker Autopilot pour la formation via un compartiment Amazon S3 chiffré dans la même zone.

Après l’entraînement AutoML, Redshift ML compile le meilleur modèle et l’enregistre en tant que fonction SQL de prédiction dans votre cluster Redshift. Vous pouvez ensuite appeler le modèle pour l’inférence en appelant la fonction de prédiction dans une instruction SELECT.

Résumé : Redshift ML utilise SageMaker Autopilot pour créer automatiquement des modèles de prédiction à partir des données que vous spécifiez via une instruction SQL, qui est extraite dans un compartiment S3. La meilleure fonction de prédiction trouvée est enregistrée dans le cluster Redshift.

Copyright © 2022 IDG Communications, Inc.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite