Ingénieur·e de recherche extraction d'information et data science H/F

Job description: Le LASTI vous invite à rejoindre son équipe pour prendre part à des projets de recherche et développement dans des domaines comme le manufacturing, la santé…. Dans le domaine de la santé, parmi les objectifs des projets en cours nous pouvons citer : le développement d’une méthodologie outillée pour la conception et le déploiement de « jumeaux numériques fonctionnels » (Functional Digital Twin) adaptés au monde hospitalier et aux processus qui régissent son fonctionnement ou la l’extraction d’information à partir de comptes-rendus médicaux en vue de réaliser un moteur de recherche facilitant la création des cohortes. Ces outils faciliteront le travail administratif des personnels de santé et permettront de prendre des décisions informées sur l’organisation des processus hospitaliers, anticiper l’impact d’évolutions législatives et réglementaires dans les parcours de soins, évaluer des scénarios d’adaptation ou encore identifier des risques. Dans nos projets de R&D, nous sommes amenés à collaborer avec des utilisateurs finaux. Dans le cas des projets santé ces utilisateurs sont des représentants des établissements publics de santé qui peuvent fournir le(s) cas d’étude et apportent leurs expertises. En fonction des projets, nos interlocuteurs peuvent également être des chercheurs des autres laboratoires CEA ou des autres organismes de recherche. En lien direct avec le(s) chef(s) du projet, vous contribuerez au projet en adaptant les outils existants au laboratoire ou en mettant en œuvre des nouveaux outils innovants pour repérer des concepts existants issus des ontologies et terminologies du domaine et repérer des termes simples et complexes. Vos missions : La veille technologique dans les domaines concernés, en cohérence avec la vision des membres du projet ; Participer à la création de nouvelles briques technologiques et à leur développement : conception et mise en œuvre de nouvelles fonctionnalités en lien avec les besoins projet ; Adaptation, extension et intégration des briques technologiques existantes pour les besoins d’analyse linguistique du projet ; Interagir avec les équipes du CEA LIST des autres briques technologiques (par exemple : moteur d’inférence en logique floue et outil de modélisation) ; Participer à la rédaction de rapports techniques et livrables projets sur la méthode développée dans le projet ainsi qu’aux publications contribuant à la dissémination des résultats. Le poste sera localisé à Palaiseau (Université Paris-Saclay). #CEA-List #AI

Institute description: Le Laboratoire d'Analyse Sémantique des Textes et des Images (LASTI) est une équipe de 25 personnes (chercheurs, ingénieurs, doctorants) menant des travaux de recherche sur les technologies de description et de compréhension du contenu multimédia (image, texte, parole) et des documents multilingues, en particulier à grande échelle. Les enjeux scientifiques sont : · développer des algorithmes efficaces et robustes pour l'analyse et l'extraction de contenu multimédia, leur classification et analyse sémantique ; · reconstitution ou fusion de données hétérogènes pour interpréter des scènes ou documents ; · développer des méthodes et des outils pour la construction, la formalisation et l'organisation des ressources et connaissances nécessaires au fonctionnement de ces algorithmes ; · intégrer plusieurs de ces briques technologiques afin d'accéder à l'information et répondre à un besoin utilisateur (moteurs de recherche, agents conversationnels, rapports synthétiques de veille)

Your profile: Niveau Bac+5 ou Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues, Compétences techniques (liste informative) : Languages de programmation : Python, JavaScript, HTML/CSS Librairies et frameworks : scikit-learn, Pytorch, optuna, spaCy, FastAPI, ONNX, celery transformers. Une connaissance des librairies de manipulation et de visualisation de données est souhaitée (pandas, seaborn, matplotlib). Devops : docker, docker-compose, slurm, git Bases de données : MongoDB, Redis, MariaDB

Languages: French Beginner,English Fluent

Related media

Talent Impulse

The Science Impulse program

Legal information

Follow us!

Contact us

We will reply as soon as possible...