Les réseaux de neurones convolutifs (CNNs) sont aujourd’hui au cœur de la vision par ordinateur, mais leur déploiement sur des systèmes embarqués (robots, objets connectés, dispositifs mobiles) reste limité par leur taille et leur consommation en énergie. Une solution consiste à compresser les modèles pour les rendre plus légers et plus rapides, sans perte importante de précision. Plusieurs approches existent (quantification des poids, factorisation bas-rang, sparsité), mais elles atteignent rapidement leurs limites lorsqu’elles sont appliquées séparément. L’objectif de cette thèse est de développer un cadre d’optimisation unifié permettant de combiner ces techniques de façon synergique. Le travail comportera une part théorique (modélisation mathématique, optimisation) et une part expérimentale (validation sur réseaux standards comme ResNet ou MobileNet, puis sur plateformes embarquées type Jetson, Raspberry Pi, FPGA). À plus long terme, l’approche pourra être testée sur d’autres architectures comme les transformers. Le projet s’appuie sur une collaboration entre un laboratoire académique spécialisé en décomposition tensorielle et un partenaire orienté hardware, offrant un encadrement complémentaire et interdisciplinaire.
mathématique, informatique
Talent impulse, le site d’emploi scientifique et technique de la Direction de la Recherche Technologique du CEA
© Copyright 2023 – CEA – TALENT IMPULSE – Tous droits réservés