loading . . . Ingénieur de recherche Intelligence artificielle et sémantique Le poste est rattaché à Direction pour la Science Ouverte (DipSO), une direction placée sous la responsabilité du Directeur général délégué Science et Innovation. La DipSO développe une offre de services, produit des études et des prototypes, conseille/forme les acteurs de la science et de la stratégie en matière de science ouverte et de numérique pour la science. Elle rassemble, pour ce faire, des compétences diverses, complémentaires (documentation, informatique, scientifique, data science) pour assurer ses services et gérer des projets sur l’ensemble de son périmètre. Elle est organisée en quatre pôles.Son pôle Numérique pour la Science (Num4Sci) contribue à consolider la politique de l’établissement en matière de numérique scientifique, en assurant la mise à disposition d’outils et de services pour la science ouverte. Ces outils et services communs visent notamment à favoriser une pratique plus ouverte et collaborative de la science, et à permettre aux communautés scientifiques de profiter davantage des opportunités du numérique.Vous serez accueilli(e) au sein de l’équipe Données et Sémantique (D&S) du pôle Num4Sci de la DipSO. Vous contribuez à l’évolution des services en matière de gestion et d’analyse des données textuelles, qu'elles soient structurées ou non. Vous contribuerez à des projets dans ce domaine en étant force de proposition sur les technologies, outils et méthodes à utiliser. Vous assurerez une veille technologique, et contribuerez à la montée en compétences de vos collègues. Vous évoluerez dans un environnement stimulant, à l’interface entre la recherche académique et les applications concrètes en sciences des données.Votre mission consistera à conduire et mettre en œuvre des projets de développement de solutions applicatives (Python) basées sur des algorithmes de machine learning ou de deep learning visant à extraire des informations sur des productions scientifiques (publications, jeux de données) à partir de différents supports (fichiers PDF, jeux de métadonnées), et à les aligner avec des référentiels (structures, individus, thématiques, mots clés...) afin, par exemple, Vous serez plus particulièrement en charge de :Mettre en œuvre des modèles d’extraction d’informations à partir de documents (NLP, LLM, etc.).Intégrer et consommer des API pour l’échange de données.Concevoir et déployer des pipelines ETL pour automatiser les flux de données.Conteneuriser les modèles/algorithmes dans des environnements Docker/Kubernetes.Mettre en place des mécanismes de suivi de performance et de détection de dérive des modèles. https://jobs.inrae.fr/ot-27353