> Offres de formation > Offres de thèses

Fusion de caractéristiques pour la ré-identification multi-vues par apprentissage profond

Défi technologique : Data intelligence dont Intelligence Artificielle (en savoir +)

Département : Département Intelligence Ambiante et Systèmes Interactifs (LIST)

Laboratoire : Laboratoire Vision et Apprentissage pour l'analyse de scènes

Date de début : 01-01-2023

Localisation : Saclay

Code CEA : SL-DRT-22-1011

Contact : astrid.sabourin@cea.fr

De nombreuses applications de suivi telles que la vidéo protection de piétons, le monitoring de vaches dans une ferme ou encore l'analyse automatique de match de sports collectifs reposent sur la bonne ré-identification des individus dans un réseau de caméras. Cependant, il peut y avoir une grande disparité en termes de point de vue sur les individus en fonction de la caméra considérée. Prenons l'exemple d'un match de rugby. Certaines caméras filment le match avec un plan large permettant de voir une grande partie du terrain et donc de localiser les individus facilement. Cependant la résolution des joueurs dans ces vues ne permet pas de les reconnaître aisément. Au contraire, d'autres caméras suivent l'action de façon beaucoup plus rapprochée. Il est plus facile d'identifier les joueurs dans cette vue. Un matching de ces deux types de vues permettrait de fusionner les informations de localisation à celles de ré-identification nécessitant plus de résolution. Cette association est loin d'être triviale du fait que les caméras sont en mouvement et qu'elles filment l'action avec des points de vue différents. L'utilisation des réseaux de neurones permet de résoudre des tâches de vision de plus en plus complexes mais des limitations sont notables lorsqu'il s'agit d'apprendre des caractéristiques robustes aux changements de point de vue et aux changements d'échelle. Dans notre cas, extraire des caractéristiques de ré-identification robustes à l'incidence et au niveau de zoom sur les individus permettrait de : 1) reconnaître un même individu quel que soit le point de vue sur celui-ci ; 2) mettre en correspondance différentes caméras qui observent les mêmes individus de deux points de vue différents. Remplir ces deux objectifs permettrait de robustifier le tracking multi-caméras des individus.

Voir toutes nos offres Télécharger l'offre (.zip)

Email Bookmark and Share