La plus grande suite de simulations cosmiques pour la formation à l’IA, téléchargeable gratuitement, stimule déjà les découvertes

Le projet CAMELS (Cosmology and Astrophysics with MachinE Learning Simulations) combine plus de 4 000 simulations cosmologiques, des millions de galaxies et 350 téraoctets de données pour déchiffrer les secrets de l’univers. Crédit : Université du Connecticut
Totalisant 4 233 simulations d’univers, des millions de galaxies et 350 téraoctets de données, une nouvelle version du projet CAMELS est un trésor pour les cosmologistes. CAMELS, qui signifie Cosmology and Astrophysics with MachinE Learning Simulation, vise à utiliser ces simulations pour former des modèles d’intelligence artificielle afin de déchiffrer les propriétés de l’univers.
Les scientifiques utilisent déjà les données, qui peuvent être téléchargées gratuitement, pour alimenter de nouvelles recherches, explique le co-chef de projet Francisco Villaescusa-Navarro, chercheur au sein du groupe d’analyse et de simulation CMB (Cosmic Microwave Background) de la Fondation Simons.
Villaescusa-Navarro dirige le projet avec des chercheurs associés au Centre d’astrophysique computationnelle (CCA) du Flatiron Institute, Shy Genel et Daniel Angls-Alczar, qui est également professeur agrégé de physique à l’UConn.
« L’apprentissage automatique révolutionne de nombreux domaines scientifiques, mais il nécessite une énorme quantité de données à exploiter », déclare Angls-Alczar. « La publication de données publiques de CAMELS, avec des milliers d’univers simulés couvrant un large éventail de physiques plausibles, offrira aux communautés de la formation des galaxies et de la cosmologie une occasion unique d’explorer le potentiel des nouveaux algorithmes d’apprentissage automatique pour résoudre une variété de problèmes. »
L’équipe CAMELS a généré les simulations à l’aide de code extrait des projets IllustrisTNG et Simba. L’équipe CAMELS comprend des membres des deux projets, Genel faisant partie de l’équipe principale d’IllustrisTNG et Angls-Alczar de l’équipe qui a développé Simba.
Environ la moitié des simulations combinent la physique du cosmos avec la physique à plus petite échelle essentielle à la formation des galaxies. Chaque simulation est exécutée avec des hypothèses légèrement différentes sur l’univers, par exemple, concernant la quantité de matière noire invisible dans l’univers par rapport à l’énergie noire séparant le cosmos, ou la quantité d’énergie que les trous noirs supermassifs injectent dans l’espace entre les galaxies.
Les chercheurs ont conçu les simulations pour alimenter des modèles d’apprentissage automatique, qui pourront ensuite extraire des informations à partir d’observations de l’univers réel et observable. Avec 4 233 simulations d’univers, CAMELS est la plus grande suite de simulations cosmologiques détaillées jamais conçue pour former des algorithmes d’apprentissage automatique.
« Les données permettront de nouvelles découvertes et relieront la cosmologie à l’astrophysique grâce à l’apprentissage automatique », déclare Villaescusa-Navarro. « Il n’y a jamais rien eu de semblable à cela, avec autant de simulations d’univers. »
L’ensemble de données CAMELS alimente déjà des projets de recherche, avec un large éventail d’articles utilisant les données en préparation.
Pablo Villanueva-Domingo de l’Université de Valence en Espagne a dirigé l’un de ces articles. Lui et ses collègues ont tiré parti des simulations CAMELS pour entraîner un modèle d’intelligence artificielle afin de mesurer la masse de notre galaxie, la Voie lactée, ainsi que son halo de matière noire environnante, ainsi que la galaxie voisine d’Andromède et son halo. Les premières mesures jamais réalisées à l’aide de l’IA ont estimé le poids de notre galaxie à 1 billion à 2,6 billions de fois la masse du soleil. Ces estimations sont à peu près conformes à celles faites par d’autres méthodes, démontrant la précision de l’approche de l’IA.
Pendant ce temps, Villaescusa-Navarro a dirigé un effort pour utiliser les données CAMELS pour estimer la valeur de deux paramètres qui régissent les propriétés fondamentales de l’univers : quelle fraction de l’univers est la matière et la répartition uniforme de la masse dans le cosmos. Tout d’abord, lui et ses collègues ont utilisé CAMELS pour générer des cartes telles que la distribution de la matière noire, du gaz et des différentes propriétés des étoiles. Ensuite, à l’aide des cartes, ils ont formé un outil d’apprentissage automatique appelé réseau de neurones pour prédire les valeurs des deux paramètres.
« Il s’agit du même type d’algorithme utilisé pour faire la différence entre un chat et un chien à partir des pixels d’une image », explique Genel, co-auteur de l’article. « L’œil humain ne peut pas déterminer la quantité de matière noire dans une simulation, mais un réseau de neurones peut le faire. »
Les résultats ont montré la promesse de tirer parti de CAMELS pour estimer précisément ces paramètres à l’avenir sur la base de nouvelles observations de l’univers, déclare Villaescusa-Navarro.
« C’est excitant de voir quelles autres nouvelles découvertes cela permettra », dit-il.
L’apprentissage automatique accélère les simulations cosmologiques
Fourni par l’Université du Connecticut
Citation: La plus grande suite de simulations cosmiques pour la formation à l’IA, téléchargeable gratuitement, stimule déjà les découvertes (2022, 7 janvier) récupéré le 24 janvier 2022 sur https://phys.org/news/2022-01-largest-cosmic-simulations-ai -free.html
Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.