[Thèse soutenue] Etienne David : Le défi de l’estimation robuste des traits avec l’apprentissage profond sur des images RVB à haute résolution

Sujet de thèse labellisée par #DigitAg

Etienne a soutenu sa thèse le 2 novembre à 9h30 en salle B020 du bâtiment AgroSciences d’Avignon Université (Campus Jean Henri Fabre).vec l’apprentissage profond sur des images RVB à haute résolution

  • Date de démarrage : mai 2018
  • Université : Avignon Université
  • Ecole doctorale : A2E – ED 536 Agrosciences & Sciences
  • Discipline / Spécialité : Agronomie, Informatique
  • Directeur de thèse : Frédéric Baret, Inrae, Emmah Avignon
  • Encadrant(es) :  Frédéric Baret et Samuel Thomas, Arvalis institut du végétal
  • Financement :  Cifre Arvalis
  • #DigitAg : Thèse labellisée – Axes 5  et 6Challenges 2 & 3

Mots-clés :  Phénotypage haut-débit, données agricoles, grandes cultures, apprentissage profond, apprentissage automatique, intelligence artificielle, vision numérique, télédétection, proxi-détection

Résumé : Le phénotypage à haut débit des plantes, notamment dans le cadre d’acquisitions en plein champ, repose sur l’interprétation de données issues de différents capteurs mis en œuvre sur des vecteurs variés tels que des tracteurs, des robots ou des drones. Initialement, ces données étaient interprétées à l’aide d’algorithmes de télédétection exploitant la résolution spectrale du signal. Mais depuis 2015, les progrès du « Deep Learning », basé sur l’entrainement à partir d’exemples, ont permis des résultats prometteurs pour mesurer des traits essentiels comme le taux de couverture ou le comptage de plantes ou d’organes. Ces algorithmes utilisent des couches de convolution apprises, permettant de tirer parti de l’organisation spatiale du signal. L’avantage de ces méthodes est qu’elles sont basées sur des capteurs Rouge-Vert-Bleu (RVB), qui sont beaucoup moins coûteux que les imageurs multi- ou hyperspectraux. Cependant, les algorithmes de Deep Learning sont sensibles aux changements de la distribution entre les données utilisées pour l’entrainement et les données prédites. En pratique, des erreurs de prédiction variables et non prédictibles d’un site à l’autre peuvent être observées. L’objectif de la thèse est de comprendre les causes de ces variations et de proposer des solutions pour des estimations de traits phénotypiques fiables en utilisant le Deep Learning. L’étude porte sur la détection de plantes et d’organes à partir d’images RVB haute résolution acquises sur le terrain. Nos travaux ont d’abord porté sur la constitution de bases de données d’images diversifiées provenant de différents lieux et stades de développement pour l’émergence de plantes (maïs, betterave, tournesol) et les épis de blé, ce qui a permis la publication de deux bases de données annotées, regroupant 27 sessions d’acquisition pour le drone et 47 pour la détection d’épis. Ces jeux de données démontrent la différence de performances entre les résultats publiés et les nôtres en raison du changement de distribution. Pour dépasser les limites des méthodes habituelles, nous avons organisé deux concours de données, les Global Wheat Challenges, en 2020 et 2021, qui nous ont permis d’obtenir des solutions entraînées pour la robustesse sur un jeu de données différent de celui de l’entraînement. L’analyse des solutions a montré l’importance des stratégies d’entraînement pour la robustesse au-delà des architectures utilisées. Nous avons également montré que ces solutions peuvent être déployées efficacement en remplacement du comptage manuel. Enfin, nous avons démontré l’inefficacité des fonctions d’entraînement conçues pour l’entraînement robuste. Notre travail ouvre la perspective d’une meilleure évaluation du Deep Learning dans le contexte du phénotypage à haut débit et donc de la confiance dans son utilisation en conditions réelles.

Contact:  etienne.david [AT] inrae.fr​

Réseaux : ResearchGateTwitter – GitHub