[Soutenance de thèse] Girault-Bogue Gnanguenon-Guesse : Modélisation et visualisation des liens entre cinétiques de variables agroenvironnementales et qualité des produits dans une approche parcimonieuse et structurée

Sujet de thèse cofinancée par #DigitAg.

Girault soutiendra sa thèse le 22 octobre à 10h00 à l’Institut Agro (Amphithéâtre 2 – Institut Agro | Montpellier SupAgro – INRAE 2 Place Pierre Viala, 34060 Montpellier)
Assister à la soutenance en visio

Je m’appelle Girault Gnanguenon Guesse et je suis doctorant en biostatistique au sein de  l’UMR MISTEA (Mathématiques, Informatique et STatistique pour l’Environnement et l’Agronomie), une unité mixte de l’Institut National de Recherches Agronomiques (INRA) et de  Montpellier SupAgro.

Après une  licence en Gestion de l’Environnement à l’Université Catholique de l’Afrique de l’Ouest, j’ai eu une première expérience au Bénin en tant qu’assistant de recherches en charge de la gestion et de l’analyse de données au sein du Laboratoire de Recherches en Ecologie Animale et de Zoogéographie. J’y ai développé des compétences en informatique décisionnelle et en statistique pour l’environnement et l’agronomie, cela m’a conforté dans mon projet de devenir chercheur en biostatistique.

Je suis diplômé du Master en Mathématiques – Parcours Statistique et Données du Vivant de l’Université de Poitiers. Un de mes stages portait sur l’analyse d’un jeu de données pluriannel pour l’entreprise de semences Vilmorin. Il s’agissait de comprendre les rendements de certains agriculteurs multiplicateurs de semences dans un contexte de changement climatique. Les résultats ont permis de proposer des leviers théoriques aux agriculteurs afin d’optimiser leurs rendements.

C’est dans cette dynamique de proposition d’outils d’aide à la décision aux professionnels que s’inscrit ma thèse.

Modélisation et visualisation des liens entre cinétiques de variables agroenvironnementales et qualité des produits dans une approche parcimonieuse et
structurée

  • Date de démarrage : décembre 2017
  • Université : MUSE Montpellier Université d’Excellence / Institut Agro – Montpellier SupAgro
  • Ecole doctorale :  ED 166 I2S – Information, Structures, Systèmes
  • Discipline / Spécialité :  Biostatistique
  • Directeur de thèse :  Nadine Hilgert (Inrae, UMR Mistea)
  • Encadrant(es)  :  Bénédicte Fontez (Institut Agro – Montpellier SupAgro, UMR Mistea) et Thierry Simonneau (Inrae, Lepse)
  • Financement : #DigitAg – Inrae
  • Projet : INNOVINE
  • #DigitAg : Thèse cofinancée – Axes 5  et 6Challenges 1, 5 et 7

Mots-clés : modèles à facteurs latents, approche parcimonieuse, inférence bayésienne, agronomie

Résumé : L’essor de l’agriculture numérique permet de plus en plus d’observer de manière automatisée et parfois à
haute fréquence des dynamiques d’élaboration de la production et de sa qualité en fonction du climat. Les
données issues de ces observations dynamiques peuvent être considérées comme des données
fonctionnelles. Analyser ce nouveau type de données nécessite d’étendre les outils statistiques usuels au cas
fonctionnel ou d’en proposer de nouveaux.
Nous avons proposé dans cette thèse une nouvelle approche (SpiceFP : Sparse and Structured Procedure to
Identify Combined Effects of Functional Predictors) permettant d’expliquer les variations d’une variable
réponse scalaire par deux ou trois prédicteurs fonctionnels dans un contexte d’influence conjointe de ces
derniers. Une attention particulière a été apportée à l’interprétabilité des résultats via l’utilisation de classes
d’intervalles combinées définissant une partition du domaine d’observation des facteurs explicatifs. Les
développements récents autour des modèles LASSO (Least Absolute Shrinkage and Selection Operator) ont
été adaptés pour estimer les régions d’influence dans la partition via une régression pénalisée généralisée.
L’approche intègre aussi une double sélection, de modèles (parmi les partitions possibles) et de variables
(pour une partition donnée) à partir des critères d’information AIC et BIC. La présentation méthodologique
de l’approche, son étude grâce à des simulations ainsi qu’une étude de cas basée sur des données réelles ont
été présentés dans le chapitre 2.
Les données réelles utilisées au cours de cette thèse proviennent d’une expérimentation viticole visant à
mieux comprendre l’impact du changement climatique sur l’accumulation d’anthocyanes dans les baies.
L’analyse de ces données dans le chapitre 3 à l’aide de l’approche SpiceFP que nous avons étendue a permis
d’identifier un impact négatif des combinaisons matinales de faible irradiance (inférieure à environ 100
μmol. m−2. s−1 ou 45 μmol. m−2. s−1 selon l’état avancé-retardé des baies) et température élevée
(supérieure à environ 25°C ). Une légère différence induite par la température de la nuit a été observée entre
ces effets identifiés en matinée.
Dans le chapitre 4 de cette thèse, nous proposons une implémentation de l’approche proposée sous la forme
d’un package R (https://CRAN.R-project.org/package=SpiceFP). Cette implémentation fournit un ensemble
de fonctions permettant de construire les intervalles de classes suivant des échelles linéaire ou
logarithmique, de transformer les prédicteurs fonctionnels grâces aux classes d’intervalles combinées puis
de mettre en œuvre l’approche en deux ou trois dimensions. D’autres fonctions facilitent la réalisation de
post-traitements ou permettent à l’utilisateur de s’intéresser à d’autres modèles que ceux retenus par
l’approche comme par exemple une moyenne de différents modèles.

Composition du jury

Élodie BRUNEL-PICCININI, Maître de conférences, Université de Montpellier : Examinatrice

Bénédicte FONTEZ, Maître de conférences, Institut Agro – Montpellier SupAgro : Co-Encadrante de thèse

Romain GLÈLÈ KAKAÏ, Professeur des universités, Université d’Abomey-Calavi : Examinateur

Nadine HILGERT, Directrice de recherche, INRAE – Montpellier : Directrice de thèse

Patrice LOISEL, Chargé de recherche, INRAE – Montpellier : Co-Encadrant de thèse

Tristan MARY-HUARD, Chargé de recherche, INRAE – Le Moulon : Rapporteur

Philippe PIERI, Chargé de recherche, INRAE – Bordeaux : Examinateur

Thierry SIMONNEAU, Directeur de recherche, INRAE – Montpellier : Co-Directeur de thèse

Nancy TERRIER, Chargée de recherche, INRAE – Montpellier : Invitée

Anne-Françoise YAO, Professeur des universités, Université Clermont-Auvergne : Rapporteure

Contact: girault-bogues.gnanguenon-guesse [AT] inrae.fr​ – Tél : +33 (0)499612595

Réseaux : LinkedIn


Actes de conférence

GNANGUENON GUESSE G, LOISEL P, FONTEZ B, SIMONNEAU T, HILGERT N. An exploratory penalized regression to identify combined effects of functional agri-environmental variables, 6 – 31 August 2020. The 30th « virtual » International Biometric Conference, Séoul, International Biometric Society, 2020

GNANGUENON GUESSE G, LOISEL P, FONTEZ B, SIMONNEAU T, HILGERT N. Explorer l’influence conjointe de prédicteurs fonctionnels sur une réponse réelle via une régression pénalisée. Recueil des soumissions de la 52èmes Journées de Statistiques, Société Française de Statistique (SfdS), 2020, pp 375-380, sciencesconf.org :jds2020:319910