[Paroles de doctorants] Benjamin Deneu : Interprétabilité des modèles de distribution de communautés d’espèces végétales appris par apprentissage profond. Application aux adventices des cultures dans le contexte de l’agroécologie

Benjamin Deneu traite un sujet de thèse cofinancé par #DigitAg et Inria

Après une prépa BCPST j’ai fait une formation d’ingénieur Agroparistech avec une spécialisation en dernière année dans la science des données et l’informatique en double diplôme avec l’université Paris Dauphine. J’ai réalisé mon stage de fin d’étude au sein de la même équipe que celle de mon doctorat ou j’ai commencé à travailler sur des problématiques proches de celles-ci. Après 1 an a travailler en ingénieur de recherche à l’INRA et l’Inria j’ai voulu continuer de travailler dans la recherche en commençant une thèse. Je suis hébergé dans l’équipe Inria Zénith au LIRMM ainsi que dans l’UMR AMAP au Cirad.

Mon sujet porte sur de nouvelles approches de modèles de distributions d’espèces se basant sur les progrès des réseaux de neurones convolutifs de ces dernières années. Ces nouveaux modèles ont l’avantage de pouvoir utiliser des données environnementales de grande dimensionnalité et d’y capturer une information écologique plus complexe et plus riche que la majorité des modèles état de l’art. Cependant leur complexité limite leur interprétabilité. Il s’agit d’étudier l’apprentissage et les prédictions de ces modèles pour mieux les interpréter et en extraire des connaissances qui pourraient se généraliser dans leur utilisation à d’autres modèles. Le contexte de l’étude est la distribution d’espèces végétales et plus particulièrement une application aux adventices de cultures.

Entre l’informatique et l’agroécologie, deux domaines que j’affectionne, ce sujet s’accorde avec ma formation pluridisciplinaire et me permet de continuer à étudier ces domaines ainsi que d’utiliser mes compétences acquises sur ces sujets.

Interprétabilité des modèles de distribution de communautés d’espèces végétales appris par apprentissage profond – Application aux adventices des cultures dans le contexte de l’agro-écologie

  • Date de démarrage : octobre 2019
  • Université : Université de Montpellier
  • Ecole doctorale : I2S – Information, Structures, Systèmes
  • Discipline / Spécialité : Informatique
  • Directeur de thèse :  Alexis Joly (Inria LIRMM), François Munoz (Université Grenoble Alpes)
  • Encadrant(es) :  Pierre Bonnet (Cirad AMAP), Maximilien Servajean (Université de Montpellier LIRMM)
  • Financement : #DigitAg – Inria
  • #DigitAg : Thèse cofinancée – Axe 5 – Challenge 1

Mots-clés : Réseaux de Neurones Profonds, Transfert de connaissance, Interprétabilité, Interactions, Paysage, Pratique agricole, Biodiversité, Adventices des cultures, Agrécologie,

Résumé :

La modélisation des interactions entre biodiversité, paysage et pratique agricole est un enjeu majeur de l’agro-écologie. Très récemment, des modèles environnementaux de distribution d’espèces se basant sur des réseaux de neurones profonds ont commencé à faire leur apparition. Ces premières expérimentations ont montré qu’ils pouvaient avoir un fort pouvoir prédictif, potentiellement bien meilleur que les modèles utilisés classiquement en écologie. Un de leurs avantages est de pouvoir apprendre un espace de représentation environnementale commun à un très grand nombre d’espèces et de stabiliser ainsi fortement les performances de prédiction d’une espèce à l’autre. Un premier objectif de la thèse sera d’étendre ce principe de transfert de connaissance au contexte de l’agro-écologie. Il s’agira en particulier d’intégrer des données caractérisant le paysage et les pratiques agricoles pour la prédiction des cortèges d’adventices des cultures et/ou des traits fonctionnels associés. Le deuxième objectif de la thèse sera de lever le verrou de l’interprétabilité de ces modèles afin d’en déduire de nouvelles connaissances tangibles en agro-écologie. Il s’agira notamment de qualifier l’espace de représentation environnemental appris par le réseau de neurones dans ses couches terminales, typiquement la dernière couche de description sur laquelle se base la régression ou classification linéaire finale. Les variables (neurones) de cet espace de représentation correspondent nécessairement à des motifs écologiques et environnementaux déterminants mais leur nature exacte est totalement inconnue. Dans le cas des modèles agro-environnementaux profonds visés dans la thèse, ces motifs intégreront également l’information du paysage et des pratiques agricoles. Leur analyse permettra de mieux comprendre la nécessité ou non de mettre en place des approches intégratives massives, reposant sur une grande variété de données d’entrée, ou à l’inverse, de se focaliser sur certains facteurs clés.

 

Contact:   benjamin.deneu [AT] inria.fr​ – Tél : +33 (0)689703608

Réseaux : ResearchGateLinkedIn

 

Communications & Publications

Conference Papers

  • Benjamin Deneu, Maximilien Servajean, Christophe Botella, Alexis Joly (2019) Evaluation of Deep Species Distribution Models Using Environment and Co-occurrences.In: Crestani F. et al. (eds) Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2019. Lecture Notes in Computer Science, 11696 (213-225) – https://doi.org/10.1007/978-3-030-28577-7_18
  • Benjamin Deneu, Maximilien Servajean, Christophe Botella, Alexis Joly (2018). Location-based species recommendation using co-occurrences and environment-GeoLifeCLEF 2018 challenge: – https://hal.archives-ouvertes.fr/hal-01913241