Ingénieur en traitement automatique de la langue - CDD 18 mois - Paris-Saclay F/H

Apply

« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »   EN SYNTHESE, QU’EST-CE QUE NOUS VOUS PROPOSONS ? Dans le cadre du développement de ses activités pour l’amélioration du traitement des données en particulier sur des aspects de confiance et de frugalité, le laboratoire recherche un ingénieur pour développer et intégrer des briques technologiques dans le domaine du traitement automatique des langues. Les tâches visées par ces technologies concernent l’extraction d’informations. Ce poste de cadre en CDD de 18 mois est basé sur le site Nano-Innov de Paris-Saclay, Essonne (91). Il s'agit d'un poste à pourvoir dès que possible. POURQUOI NOUS REJOINDRE ? Vous intégrez une équipe dynamique, au cœur de l’écosystème IA en France, qui a noué des liens privilégiés avec les principaux acteurs industriels et académiques du domaine. Le laboratoire développe des algorithmes robustes pour l'extraction, l'analyse et le l'interprétation de grands volumes de données multimédia (texte/image). Nos technologies ont contribué à l'émergence de nouvelles activités économiques par la création de startups. Le laboratoire participe à de nombreux projets collaboratifs (ANR, Horizon Europe, Pôle de Compétitivité) avec des partenaires académiques, PMEs ou grands industriels QU’ATTENDONS-NOUS DE VOUS ? Dans l'objectif de mettre en place ces outils d'analyse de textes pour la détection d’évènements d’intérêt à partir des informations disponibles sur le Web et les réseaux sociaux, votre mission consistera plus particulièrement à :  prendre en main et améliorer les outils existants d'analyse de textes développés au sein du laboratoire intégrer et/ou développer de nouveaux outils de reconnaissance d’entités nommées et détection d’évènements, selon la nature des informations à associer aux données (qui dépendra des taxonomies et terminologies fournies par les partenaires) favoriser les approches multilingues ou indépendantes de la langue dans les outils développés afin de pouvoir traiter des contenus textuels multilingues assurer l'intégration de ces briques technologiques au sein des plateformes logicielles des partenaires réaliser le packaging, définir avec les autres partenaires les environnements, assurer les tests techniques et la compatibilité entre les packages ; rédiger, contrôler et mettre à jour les documents nécessaires à la mise en exploitation améliorer le fonctionnement et la qualité des briques développées en interaction avec les utilisateurs/partenaires assurer la liaison avec les autres partenaires et prendre en charge le support technique effectuer de la veille technologique et scientifique L’application de ce travail pourra se faire dans le cadre d’un domaine spécifique à un projet, mais les approches mises en œuvre devront être suffisamment génériques pour s’appliquer sur n’importe quel domaine.

Au sein du CEA List, vous serez intégré au Service d'Intelligence Artificielle pour le Langage et la Vision (SIALV) et collaborerez avec des chercheurs spécialisé sur (i) la compression de réseaux de neurones (ii) la vision par ordinateur frugale à partir de nuages de points 3D (iii) les modèles génératifs visuels. Vous travaillerez dans un projet en collaboration avec un autre laboratoire du CEA List, le Laboratoire Intelligence Artificielle Embarquée (LIAE), qui a pour mission le développement de solutions innovantes pour l'IA embarquée et est le principal contributeur de la plateforme logicielle open source de conception, d'optimisation et d'intégration de réseaux de neurones pour l'embarqué, N2D2 (https://github.com/CEA-LIST/N2D2). Cette plateforme a pour vocation d'être la plateforme européenne de référence pour l'IA embarquée, avec le soutien d'un large consortium d'industriels et de fournisseurs de composants.

COMPÉTENCES REQUISES : Niveau Bac+5 ou Doctorat avec des connaissances en machine learning, deep learning et traitement automatique des langues. Compétences techniques :  Le candidat sera amené à travailler sur tous les aspects du développement de la solution: conception, programmation, packaging et déploiement. Dans ce contexte, une familiarité avec Linux et l’outil Docker est un avantage. Par ailleurs, le langage de programmation principal sera Python. Langages de programmation : Python, JavaScript, HTML/CSS, C++; Librairies et frameworks : scikit-learn, Pytorch, optuna, spaCy, FastAPI; DevOps : docker, docker-compose, slurm, git  Compétences savoir-être : Autonomie tout en appréciant le travail en équipe ; Adaptabilité et capacité de renouvellement et d'enrichissement des compétences de manière continue, étant donné la rapidité d’évolution des développements en IA; Capacités d'expression, orale et écrite, en français et anglais VOUS AVEZ ENCORE UN DOUTE ? Les à-côtés de votre mission principale peuvent nous intéresser :  Un écosystème de recherche à la pointe, unique en son genre et dédié à des thématiques à fort enjeu sociétal, qui donne du sens à votre mission Des formations pour renforcer vos compétences, en acquérir de nouvelles et booster votre mission Un équilibre vie privée / vie professionnelle reconnu par nos collaborateurs La possibilité de télétravailler pour équilibrer les temps de transport et contribuer à votre qualité de vie Un CE riche en avantages et en activités sociales, culturelles et sportives Un lieu de travail au cœur d’un plateau dynamique, entouré d’écoles et d’entreprises de la tech  Cela vous tente ? Postulez, ce poste est fait pour vous !   Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à toutes et à tous #CEA-List #NumericalSimulation #AI

French Fluent,English Fluent

en_USEN

Contact us

We will reply as soon as possible...