Emploi / Doctorat

Transformer de vision multimodale efficace pour système embarqué

Défi technologique : Les nouveaux paradigmes informatiques, dont le calcul quantique, Réseaux de communication, internet des objets, radiofréquences et antennes, Systèmes cyberphysiques – capteurs et actionneurs, Technologies pour la santé et dispositifs médicaux,
Type de contrat : Doctorat
Institut :
Localisation : Paris – Saclay
Niveau d'étude : BAC+5
Disponibilité du poste : 2025-10-01
Encadrant : POREBA Martyna (DRT/DSCIN/DSCIN/LIAE)

Description de l'offre : La thèse proposée se concentre sur lapos;optimisation des transformers multimodaux de vision (ViT) pour la segmentation panoptique dapos;objets, en explorant deux axes principaux. Il sapos;agit dapos;abord de développer un pipeline de fusion polyvalent pour intégrer des données multimodales (RGB, IR, profondeur, événements, nuages de points), en exploitant les relations dapos;alignement inter-modales. Ensuite, une approche combinant le pruning et la quantification à précision mixte sera étudiée. Lapos;objectif global est de concevoir des modèles ViT multimodaux légers, adaptés aux contraintes des systèmes embarqués, tout en optimisant leurs performances et en réduisant la complexité computationnelle.

Profil du candidat : Master en informatique/vision par ordinateur/intelligence artificielle