DarkBERT AI formé sur le dark web pour lutter contre la cybercriminalité – Spiceworks

  • Les chercheurs ont développé DarkBERT, un modèle de langage formé sur les données du dark web.
  • L’IA vise à aider les professionnels de la cybersécurité à extraire des renseignements sur les cybermenaces du ventre obscur d’Internet.

Des chercheurs du Korea Advanced Institute of Science and Technology (KAIST), en collaboration avec l’organisation d’intelligence de données S2W, ont dévoilé DarkBERT, un modèle de langage d’IA génératif qui a été formé exclusivement sur des ensembles de données provenant du dark web.

Au lieu d’un chatbot comme ChatGPT ou Bard, le projet vise à créer un outil pour analyser des ensembles de données et répondre à des requêtes spécifiques. DarkBERT peut vérifier si l’utilisation du dark web en tant qu’ensemble de données permettrait aux outils d’IA de mieux comprendre le langage utilisé dans ces paramètres, ce qui pourrait en faire une aide précieuse pour les professionnels de la cybersécurité et les forces de l’ordre.

En savoir plus : Elon Musk confirme l’embauche d’un nouveau PDG de Twitter

Des chercheurs ont utilisé le réseau Tor pour former un modèle d’IA

Pour optimiser l’adaptation de DarkBert au langage utilisé sur le dark web, l’équipe de recherche a créé une base de données à grande échelle en explorant le réseau Tor. L’équipe a également utilisé la déduplication, le filtrage des données et le prétraitement dans le but de dissiper les préoccupations éthiques associées au contenu Web sombre, qui contient souvent des informations sensibles.

Le modèle a alimenté deux ensembles de données sur 16 jours, les données prétraitées contenant des informations expurgées telles que les noms des organisations victimes, des détails sur les données divulguées, les déclarations de menace et les images illégales. Plus d’un millier de pages de cet ensemble de données ont été classées comme divertissement pour adultes.

En raison de la nature potentiellement risquée des matériaux du dark web, DarkBert ne sera pas disponible au public de sitôt. Cependant, à l’heure actuelle, des demandes d’utilisation du modèle d’IA à des fins académiques peuvent être faites.

Votre organisation utilise-t-elle l’IA pour la cybersécurité ? Faites-le nous savoir sur LinkedInOuvre une nouvelle fenêtre