Offre: Au-delà de la réglementation, l’externalisation de données sensibles (données secrètes et données souveraines) en dehors du site industriel ou hébergeur certifié, afin d’y faire des traitements ou analyses dans des infrastructures de calcul externe (type Cloud), est encore freinée en raison de l’absence de solutions garantissant la confidentialité de ces données. Les données de santé dont la génomique se positionnent aujourd’hui parmi les disciplines les plus impactées par ses contraintes d’exploitation de l’information. Si le développement de la médecine génomique du futur se trouve aujourd’hui ralenti et limité par ces contraintes, elle s’installe cependant progressivement dans le parcours du soin du patient. De nombreuses études en apprentissage automatique ont notamment émergé pour traiter la complexité des données omiques et démontrer l'intérêt de leur intégration dans la caractérisation et la classification détaillée des pathologies tumorales. Les enjeux scientifiques sont multiples. La découverte de biomarqueurs robustes pour la classification du cancer en s’appuyant sur des données issues de différentes modalités expérimentales complémentaires est un enjeu clé. Aujourd’hui le partage de l’information conditionne le développement de modèle performant basé sur une représentation exhaustive de la population. Dans ce contexte de partage et de protection de l’information le chiffrement est aujourd’hui un axe envisagé pour la protection des données de santé. Le chiffrement homomorphe permet notamment d’effectuer des opérations dans le domaine chiffré, sans avoir accès à la clé de déchiffrement. DSCIN/LCYL dispose aujourd’hui d’une expertise et des solutions sécurisées adaptées aux traitements avancés sur les données et leur interprétation. Les développements récents du DSCIN permettent notamment d’envisager l’installation de modèle d’apprentissage fédéré protégé par chiffrement homomorphe. Le LIST/DSCIN en partenariat avec le Centre National de Recherche en Génomique Humaine (CNRGH/CEA) ont entamé le développement d’un framework fédéré dédié à l’exploitation de données de santé appliqué à la génomique. Le LIST/DSCIN recherche un étudiant de Master 2 ou équivalent pour un stage de recherche d'une durée de 5 à 6 mois afin de réaliser l’implémentation de libraires au sein d’un framework dédié à l’apprentissage fédéré protégé par chiffrement homomorphe. Ces travaux couvriront notamment l’intégration de la bibliothèque openFHE appliqué aux transferts de paramètres et à leur agrégation au travers de différentes stratégies. Ces développements seront accompagnés d’une étude de l’impact sur les performances de différents modèles et de leur frugalité. Dans un second temps, en accord avec la dynamique du stage, le candidat travaillera également sur l’implémentation d’un contrôle multi-clé au sein du framework et pourra aborder les problématiques associés à la gestion d’un système de confidentialité différentielle.
Au sein de CEA Tech, le pôle « recherche technologique » du CEA, l'Institut List dédie ses activités aux systèmes numériques intelligents avec des programmes de R&D dans le manufacturing avancé, les systèmes embarqués, et l'intelligence ambiante. Nous accompagnons nos partenaires dans les domaines des transports, de l'industrie, de l'énergie, de la santé, de la sécurité et de la défense, pour transférer les technologies issues de l'innovation et améliorer leur compétitivité. Le Laboratoire pour la Confiance des sYstèmes de calcuL (LCYL) de l'institut LIST consacre une partie de ses activités de recherche à l'apprentissage automatique préservant la confidentialité selon un schéma de chiffrement entièrement homomorphe avec calcul vérifiable.
Niveau Master M2 ou équivalent / Formation Informatique/Mathématique - Cryptographie
Bac+5 - Master 2
English Fluent
Talent impulse, the scientific and technical job board of CEA's Technology Research Division
© Copyright 2023 – CEA – TALENT IMPULSE - All rights reserved