Outils d’apprentissage profond et mesure d'incertitude

Outils d’apprentissage profond et mesure d'incertitude pour les données spectroscopiques. Applications et Benchmark pour les données d’intérêt agronomiques

Discipline principale : Intelligence Artificielle, Data Science, Agronomie Durée souhaitée du stage : 6 mois Date de début du stage : Mars 1, 2025 Unité de recherche : UMR ITAP Encadrant : Maxime Metz Contact : m.metz[at]pellencst.com

Contexte et enjeux

Ce stage s'inscrit dans un projet visant à utiliser les techniques d'intelligence artificielle (IA) pour résoudre des défis liés aux données spectroscopiques dans le domaine agro-environnemental. L'objectif principal est d'adapter des modèles de laboratoire à un déploiement sur le terrain, notamment en lien avec la mesure de l'incertitude dans les prédictions des réseaux de neurones appliqués à des données spectroscopiques. Ce projet s'appuie sur les connaissances développées dans le cadre du LabCom AIOLy, avec une application dans l'agronomie, notamment pour des problématiques de phénotypage et de détection de pathologies agricoles.

Objectifs du stage

  • Tester différentes méthodes de quantification de l’incertitude pour les réseaux de neurones appliqués à des données spectroscopiques d’intérêt agronomique.
  • Identifier les approches les plus pertinentes pour traiter les données spectrales et les architectures d’apprentissage en chimiométrie.
  • Comparer et confronter ces approches à travers une étude de benchmark sur des données réelles issues de diverses applications agronomiques.
  • Réaliser une publication scientifique sur l’impact de la quantification de l’incertitude dans les modèles de chimiométrie basés sur l’apprentissage profond.

Méthodologie

Le stagiaire devra effectuer une recherche bibliographique ciblée sur les approches existantes de quantification de l’incertitude en apprentissage profond. Ensuite, il ou elle devra :

  1. Identifier les méthodes les plus adaptées aux données spectrales et aux défis spécifiques de la chimiométrie.
  2. Mettre en œuvre les réseaux de neurones disponibles dans le laboratoire de recherche AIOLy et les appliquer à des bases de données agronomiques historiques (par exemple, données sur le sol, la qualité des fruits et le phénotypage).
  3. Effectuer un benchmark des modèles d’apprentissage profond appliqués à la chimiométrie, en se concentrant sur les méthodes suivantes :
    • Réseaux de neurones bayésiens
    • Approches ensemblistes
    • Approches bayésiennes simplifiées (MC-dropout, SWAG)

Profil recherché

Le stage s'adresse à un(e) étudiant(e) ayant un fort intérêt pour la programmation et le calcul scientifique, ainsi qu'un bon niveau de compréhension des approches mathématiques et des réseaux de neurones. L’étudiant(e) devrait être familier avec les techniques de machine learning et de programmation GPU (PyTorch). Un intérêt pour les données agronomiques, la spectroscopie et la chimiométrie serait un plus.

Enjeux scientifiques

Ce projet vise à répondre à un défi majeur de la chimiométrie : comment mesurer l'incertitude des prédictions des modèles d'apprentissage profond appliqués aux données spectroscopiques dans des conditions de mesure variables et parfois extrêmes. Il explorera l'impact de différentes stratégies de quantification de l'incertitude sur la validité et la robustesse des modèles en environnement réel.