[Thèse soutenue] Girault-Bogue Gnanguenon-Guesse

[Thèse soutenue] Girault Gnanguenon: Modélisation et visualisation des liens entre cinétiques de variables agroenvironnementales et qualité des produits dans une approche parcimonieuse et structurée

Girault a soutenu sa thèse le 22 octobre à 10h00 à l’Institut Agro (Amphithéâtre 2 – Institut Agro | Montpellier SupAgro – INRAE 2 Place Pierre Viala, 34060 Montpellier)

Modélisation et visualisation des liens entre cinétiques de variables agro environnementales et qualité des produits dans une approche parcimonieuse et structurée

Sujet de thèse cofinancée par #DigitAg
 

Je m’appelle Girault Gnanguenon Guesse et je suis doctorant en biostatistique au sein de  l’UMR MISTEA (Mathématiques, Informatique et STatistique pour l’Environnement et l’Agronomie), une unité mixte de l’Institut National de Recherches Agronomiques (INRA) et de  Montpellier SupAgro. Après une  licence en Gestion de l’Environnement à l’Université Catholique de l’Afrique de l’Ouest, j’ai eu une première expérience au Bénin en tant qu’assistant de recherches en charge de la gestion et de l’analyse de données au sein du Laboratoire de Recherches en Ecologie Animale et de Zoogéographie. J’y ai développé des compétences en informatique décisionnelle et en statistique pour l’environnement et l’agronomie, cela m’a conforté dans mon projet de devenir chercheur en biostatistique. Je suis diplômé du Master en Mathématiques – Parcours Statistique et Données du Vivant de l’Université de Poitiers. Un de mes stages portait sur l’analyse d’un jeu de données pluriannel pour l’entreprise de semences Vilmorin. Il s’agissait de comprendre les rendements de certains agriculteurs multiplicateurs de semences dans un contexte de changement climatique. Les résultats ont permis de proposer des leviers théoriques aux agriculteurs afin d’optimiser leurs rendements.
C’est dans cette dynamique de proposition d’outils d’aide à la décision aux professionnels que s’inscrit ma thèse.

  • Date de démarrage : décembre 2017
  • Université : MUSE Montpellier Université d’Excellence - Institut Agro
  • Ecole doctorale :  ED 166 I2S – Information, Structures, Systèmes
  • Discipline / Spécialité :  Biostatistique
  • Directeur de thèse :  Nadine Hilgert (Inrae, UMR Mistea)
  • Encadrant(es)  :  Bénédicte Fontez (Institut Agro, UMR Mistea) et Thierry Simonneau (Inrae, Lepse)
  • Financement : #DigitAg – Inrae
  • Projet : INNOVINE
  • #DigitAg : Thèse cofinancée – Axes 5  et 6Challenges 1, 5 et 7

Mots-clés : Modèles à facteurs latents, approche parcimonieuse, inférence bayésienne, agronomie

Résumé : L’essor de l’agriculture numérique permet de plus en plus d’observer de manière automatisée et parfois à haute fréquence des dynamiques d’élaboration de la production et de sa qualité en fonction du climat. Les données issues de ces observations dynamiques peuvent être considérées comme des données fonctionnelles. Analyser ce nouveau type de données nécessite d’étendre les outils statistiques usuels au cas fonctionnel ou d’en proposer de nouveaux. Nous avons proposé dans cette thèse une nouvelle approche (SpiceFP : Sparse and Structured Procedure to Identify Combined Effects of Functional Predictors) permettant d’expliquer les variations d’une variable réponse scalaire par deux ou trois prédicteurs fonctionnels dans un contexte d’influence conjointe de ces derniers. Une attention particulière a été apportée à l’interprétabilité des résultats via l’utilisation de classes d’intervalles combinées définissant une partition du domaine d’observation des facteurs explicatifs. Les développements récents autour des modèles LASSO (Least Absolute Shrinkage and Selection Operator) ont été adaptés pour estimer les régions d’influence dans la partition via une régression pénalisée généralisée. L’approche intègre aussi une double sélection, de modèles (parmi les partitions possibles) et de variables (pour une partition donnée) à partir des critères d’information AIC et BIC. La présentation méthodologique de l’approche, son étude grâce à des simulations ainsi qu’une étude de cas basée sur des données réelles ont été présentés dans le chapitre 2. Les données réelles utilisées au cours de cette thèse proviennent d’une expérimentation viticole visant à mieux comprendre l’impact du changement climatique sur l’accumulation d’anthocyanes dans les baies. L’analyse de ces données dans le chapitre 3 à l’aide de l’approche SpiceFP que nous avons étendue a permis d’identifier un impact négatif des combinaisons matinales de faible irradiance (inférieure à environ 100 μmol. m−2. s−1 ou 45 μmol. m−2. s−1 selon l’état avancé-retardé des baies) et température élevée (supérieure à environ 25°C ). Une légère différence induite par la température de la nuit a été observée entre ces effets identifiés en matinée. Dans le chapitre 4 de cette thèse, nous proposons une implémentation de l’approche proposée sous la forme d’un package R (https://CRAN.R project.org/package=SpiceFP). Cette implémentation fournit un ensemble de fonctions permettant de construire les intervalles de classes suivant des échelles linéaire ou logarithmique, de transformer les prédicteurs fonctionnels grâces aux classes d’intervalles combinées puis de mettre en œuvre l’approche en deux ou trois dimensions. D’autres fonctions facilitent la réalisation de post-traitements ou permettent à l’utilisateur de s’intéresser à d’autres modèles que ceux retenus par l’approche comme par exemple une moyenne de différents modèles.

Composition du jury

Élodie BRUNEL-PICCININI, Maître de conférences, Université de Montpellier : Examinatrice
Bénédicte FONTEZ, Maître de conférences, Institut Agro – Montpellier SupAgro : Co-Encadrante de thèse
Romain GLÈLÈ KAKAÏ, Professeur des universités, Université d’Abomey-Calavi : Examinateur
Nadine HILGERT, Directrice de recherche, INRAE – Montpellier : Directrice de thèse
Patrice LOISEL, Chargé de recherche, INRAE – Montpellier : Co-Encadrant de thèse
Tristan MARY-HUARD, Chargé de recherche, INRAE – Le Moulon : Rapporteur
Philippe PIERI, Chargé de recherche, INRAE – Bordeaux : Examinateur
Thierry SIMONNEAU, Directeur de recherche, INRAE – Montpellier : Co-Directeur de thèse
Nancy TERRIER, Chargée de recherche, INRAE – Montpellier : Invitée
Anne-Françoise YAO, Professeur des universités, Université Clermont-Auvergne : Rapporteure

Contact : benedicte.fontez [AT] supagro.fr – Tél: +33 (0)4.99.61.25.95

Réseaux : LinkedIn

Publications

Télécharger le mémoire de thèse

Actes de conférence

GNANGUENON GUESSE G, LOISEL P, FONTEZ B, SIMONNEAU T, HILGERT N. An exploratory penalized regression to identify combined effects of functional agri-environmental variables, 6 – 31 August 2020. The 30th « virtual » International Biometric Conference, Séoul, International Biometric Society, 2020

GNANGUENON GUESSE G, LOISEL P, FONTEZ B, SIMONNEAU T, HILGERT N. Explorer l’influence conjointe de prédicteurs fonctionnels sur une réponse réelle via une régression pénalisée. Recueil des soumissions de la 52èmes Journées de Statistiques, Société Française de Statistique (SfdS), 2020, pp 375-380, sciencesconf.org :jds2020:319910