Défi technologique : Data intelligence dont Intelligence Artificielle (en savoir +)
Département : Département Ingénierie Logiciels et Systèmes (LIST)
Laboratoire : Labo.conception des systèmes embarqués et autonomes
Date de début : 01-10-2023
Localisation : Saclay
Code CEA : SL-DRT-23-0826
Contact : ansgar.radermacher@cea.fr
Au cours de la dernière décennie, les réseaux neuronaux profonds (DNN) sont devenus un choix populaire pour mettre en ?uvre les composants basés sur de l'apprentissage (LEC) dans les systèmes automatisés grâce à leur efficacité dans le traitement d'entrées complexes et à leur puissant apprentissage de représentation qui surpasse les performances des méthodes traditionnelles. Malgré les progrès remarquables réalisés dans l'apprentissage des représentations, les réseaux neuronaux doivent également représenter la confiance dans leurs prédictions pour pouvoir être déployés dans des systèmes critiques en termes de sécurité. Les réseaux neuronaux bayésiens (BNN) offrent un cadre fondé sur des principes pour modéliser et capturer l'incertitude dans les LEC. Cependant, l'inférence exacte dans les BNN est difficile à calculer. Nous nous appuyons donc sur des techniques d'échantillonnage pour obtenir une approximation de la véritable postériorité des poids afin de calculer la distribution prédictive postérieure (inférence). À cet égard, des méthodes d'échantillonnage relativement simples mais coûteuses en calcul et en mémoire ont été proposées pour l'inférence bayésienne approximative afin de quantifier l'incertitude dans les DNN, par exemple le Monte-Carlo dropout ou les Deep Ensembles. L'estimation efficace de l'incertitude des DNN sur des plates-formes matérielles à ressources limitées reste un problème ouvert, limitant l'adoption dans les applications de systèmes hautement automatisés qui possèdent des budgets de calcul et de mémoire stricts, des contraintes de temps courtes et des exigences de sécurité. Cette thèse vise à développer de nouvelles méthodes et des optimisations matérielles pour une estimation efficace et fiable de l'incertitude dans les architectures DNN modernes déployées dans des plateformes matérielles avec des ressources de calcul limitées.