Les offres de thèses

Les offres de thèses

#DigitAg propose des sujets de thèses interdisciplinaires cofinancées

Le doctorant s'engage à participer aux activités #DigitAg (en particulier aux journées des doctorants, et à la #DigitAgora) et contribue aux échanges d’informations entre son laboratoire d’accueil et la communauté #DigitAg.
Le doctorant pourra également être invité à enseigner dans les masters de la #Graduate School ou dans les écoles-chercheurs organisées par l’Institut.

Les publications issues des travaux de thèse doivent aussi mentionner que le travail a été soutenu par l’Institut Convergences #DigitAg et France 2030 (ANR-16-CONV-0004).

Les sujets affichés ont été sélectionnés par #DigitAg qui les cofinancent
En savoir plus ? Rapprochez-vous du contact indiqué pour le sujet qui vous intéresse

Sujets sélectionnés:

Sciences de la Vie et de l’Environnement - Sciences pour l'Ingénieur 

SemCrop – Représentation sémantique et modulaire des modèles de culture
thèse pourvue

Mots-clé : Agroécologie, Assimilation de données, Crop2ML, Modèles de culture, Modèles hybrides, Modularité, Sémantiques, Workflows

  • Contact: Pierre Martre - pierrre.martre [AT] inrae.fr
  • Directeurs de thèse : Pierre Martre, Lepse, Inrae et Christophe Pradal, UMR Agap, Cirad
  • Encadrants: Pierre Martre, Lepse, Inrae - Christophe Pradal, UMR Agap, Cirad
  • Unités d’accueil: Lepse - Agap
  • Cofinancement : Inrae
  • #DigitAg: Axe 6 : Modélisation et simulation (systèmes de production agricole), Axe 4 : Système d’information, stockage et transfert de données, Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Challenge 0 : sujet transversal, Challenge 1 : Le challenge agroécologique, Challenge 2 : Le phénotypage rapide, Challenge 3 : La protection des cultures, Challenge 5 : Les services de conseil agricole, Challenge 8 : Développement agricole au Sud

L'utilisation des modèles de culture pour prédire la performance et l’impact environnemental des cultures se généralise à tous les niveaux de la chaîne de valeur. Leur utilisation pour réduire l’usage d’intrants, adapter l’agriculture face au changement climatique, diversifier les agro-systèmes, préserver la biodiversité, et ainsi répondre aux objectifs du Green Deal, conduisent à constamment revoir leurs formalismes et à modéliser de nouveaux processus.
Nous avons récemment développé le système de représentation et de transformation de modèles Crop2ML (Crop Modelling Meta Language), qui permet de développer des composants de modèles en respectant les principes FAIR. Une limite actuelle de Crop2ML est l’absence de sémantique pour rechercher des composants et faciliter leur composition dans des solutions de modélisation opérationnelles.
Le projet SemCrop vise à combler cette limitation. Les objectifs opérationnels concernent l’interopérabilité des outils de modélisation et les liens avec les systèmes d’information recueillant des données souvent massives. Une modularité des modèles au niveau des processus est visée afin de permettre une meilleure intégration à différentes échelles, faciliter le lien avec les données, et les rétrocontrôles entre données et modèles (jumeaux numériques).
En proposant un système de modélisation modulaire, SemCrop apportera une contribution originale pour répondre aux enjeux des transitions écologiques, climatiques, et numériques. Il fournira à #DigitAg et aux entreprises régionales de l’AgTech (ITK, SMAG, FruitionSciences,…) des outils innovants pour développer des solutions numériques pour l’agriculture. SemCrop accroitra la portée internationale des recherches de #DigitAg via son insertion dans l’initiative AMEI (Agriculture Model Exchange Initiative) coordonnées par les encadrants.

Intégration et normalisation de bases de données expérimentales dans le domaine de l’agroécologie: approches de fouille de textes guidées par des informations sémantiques
thèse pourvue

Mots-clé : Agro-écologie, hétérogénéité, normalisation, base de données, fouille de texte, modèle de langue, modélisation, ontologie, interopérabilité

  • Contact: Auzoux Sandrine - sandrine.auzoux [AT] cirad.fr
  • Directeurs de thèse : Jonquet Clément, UMR Mistea, Inrae et Mathieu Roche, UMR Tetis, Cirad
  • Encadrants: Sandrine Auzoux, UR Aïda, Cirad – Mathieu Roche, UMR Tetis, Cirad
  • Unités d’accueil: Aïda - Tetis
  • Cofinancement : Programme Opérationnel Réunion
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données, Axe 4 : Système d’information, stockage et transfert de données, Axe 6 : Modélisation et simulation (systèmes de production agricole), Challenge 1 : Le challenge agroécologique, Challenge 3 : La protection des cultures, Challenge 8 : Développement agricole au Sud

Les études agro-écologiques génèrent de nombreuses bases de données hétérogènes en termes de structure et de contenu, qui sont difficilement exploitables et nécessitent une curation pour être mobilisées dans des approches statistiques ou de modélisation. La curation consiste à sélectionner les données les plus pertinentes et les enrichir de métadonnées nécessaires à leur compréhension pour pouvoir les rendre accessibles, partageables et réutilisables (principes FAIR). De manière concrète, les bases de données contiennent des variables créées manuellement par des experts. Les modèles agronomiques s’appuient sur ces bases de données expertes par nature hétérogène.  La réutilisation de ces données, leur intégration et leur compréhension est un problème difficile dans un cadre d’automatisation et d’application aux modèles de cultures. L'objectif de cette thèse consiste à proposer une approche générique pour automatiser la labellisation des variables créés par les experts et leur mise en relation avec les variables des modèles, en mobilisant des méthodes de fouille de texte guidées par des informations sémantiques.

 

Sciences de la Vie et de l’Environnement - Mathématiques et leurs applications 

Identification des observations inattendues dans les projets de crowdsourcing territoriaux en agriculture : le cas du suivi de l’état hydrique de la vigne à l’échelle régionale

Mots-clé: crowdsourcing, état hydrique de la vigne, données aberrantes, observations surprenantes, approche bayésienne, statistiques spatiales, prédiction conformelle

  • Contact: Léo Pichon - leo.pichon [AT] supagro.fr
  • Encadrants: Bruno Tisseyre, UMR Itap, Institut Agro Montpellier – Léo Pichon, UMR Itap, Institut Agro Montpellier
  • Unités d’accueil: UMR Itap
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 3: Capteurs, acquisition et gestion de données, Challenge 5 : Les services de conseil agricole, Challenge 6 : La gestion des territoires agricoles

Dans un contexte de changement climatique, suivre l’état hydrique du vignoble à l’échelle régionale est un enjeu capital pour aider les acteurs de la filière viticole dans leurs prises de décision à court et à long terme. L’une des approches prometteuses pour réaliser ce suivi est la collecte collaborative d’observations par les acteurs de la filière viticole (crowdsourcing). Le crowdsourcing a déjà montré sa capacité à collecter un volume de données important, en particulier à travers l’application ApeX-Vigne initiée par l’équipe de ce projet. Le chaînon manquant pour que cette approche se démocratise est le développement de méthodes d’analyse des données collectées. L’identification d’observations inattendues est un enjeu particulièrement fort, car celles-ci peuvent être soit des observations aberrantes qui doivent être éliminées pour améliorer la qualité globale du jeu de données, soit, au contraire, des observations intéressantes qui traduisent un système de culture original ou des conditions pédo-climatiques atypiques. 

Les phénomènes étudiés sont saisonniers et se déroulent généralement selon une dynamique temporelle connue. Ils dépendent également souvent du milieu (sol, climat, etc.) et sont donc aussi structurés dans l’espace. Les approches proposées dans le cadre de cette thèse chercheront à s’appuyer sur cette connaissance des phénomènes étudiés pour définir un comportement attendu et identifier les observations qui s’en écartent. La formalisation de cette connaissance pourra s’appuyer sur des données historiques (ex: séries temporelles d’observations de référence) ou des données auxiliaires (ex: séries temporelles d’images de télédétection). Des méthodes de statistiques spatio-temporelles seront utilisées, et un cadre bayésien sera privilégié. D’autres approches, comme l’utilisation de prédiction conformelle pourront également être testées.

Vers un prototype d'expérimentation on Farm des effets des produits de biocontrôle sur le blé, approche par modèle numérique
thèse pourvue

Mots-clé: Biosolutions, modèle numérique, blé, septoriose, On Farm Experimentation, agro-écologie

  • Contact: Bénédicte Fontez - benedicte.fontez [AT] supagro.fr
  • Encadrants: Bénédicte Fontez, UMR Mistea, Institut Agro - Elsa Ballini, UMR Phim, Institut Agro
  • Unités d’accueil: UMR Mistea - UMR Phim
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 6 : Modélisation et simulation (systèmes de production agricole), Challenge 3 : La protection des cultures, Challenge 1 : Le challenge agroécologique

La validation de l’efficacité des produits de biocontrôle/ biostimulation est soumise à des difficultés de passage au terrain ce qui explique partiellement le manque de solution ou leur faible acceptation par la profession. En effet, les facteurs ayant une influence sur la réaction d’une culture et l’efficacité des biosolutions étant multiples et interagissant entre eux, il paraît peu probable de pouvoir proposer une évaluation multifactorielle complète sur le terrain. Il est donc nécessaire de proposer un modèle numérique qui facilitera à terme l’évaluation multifactorielle de l’efficacité des biosolutions. En effet, le modèle numérique permettra de simuler des valeurs de références ou attendues et de comparer à la réalité des données. Plusieurs projets existants fournissent des données exploitables pour étudier la faisabilité d’un modèle numérique capable de simuler la réaction du blé aux bio-solutions. Le cœur de la thèse correspond à la formulation d’un premier modèle théorique et son adaptation dans un système plus ouvert (au champ). Il s’agira 1) Etablir un premier modèle mathématique à partir de données de laboratoire 2) Proposer un modèle numérique (intégrant l’apprentissage automatique au modèle mathématique) 3) Préfiguration d’un protocole de validation des effets des bio-solutions dans un dispositif multiparcelles « On Farm ». La thèse bénéficie d’une collaboration entre les UMR MISTEA et PHIM et d’un partenariat avec l’institut technique Avalis, le centre de ressources technologiques Vegenov (expérimentateurs de biosolutions), l’entreprise Frayssinet (producteur de biosolutions) et le réseau BeStim pour travailler vers un transfert rapide du modèle vers la profession et les agriculteurs.

 

Sciences Humaines et Sociales - Sciences de la Vie et de l’Environnement

Etude de l’impact économique des outils numériques chez les agriculteurs ouest-africains

Mots-clé: Numérique, Productivité, Revenu, Agriculture, Afrique de l’Ouest

  • Contact: Serena FERRARI - serena.ferrari [AT] cirad.fr
  • Encadrants: Serena Ferrari, UMR Selmet, Cirad - Catherine ARAUJO BONJEAN, CNRS
  • Unités d’accueil: Selmet 
  • #DigitAg: Axe 1 : Impact des technologies de l'information et de la communication sur le monde rural, Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Challenge 0 : sujet transversal, Challenge 8 : Développement agricole au Sud

En Afrique de l'Ouest, la pauvreté rurale touche plus la moitié de la population alors que l'agriculture dans la région est confrontée à des défis tels que la saisonnalité des revenus, le manque d'accompagnement technique, etc. L'étude examinera comment les outils numériques, tels que la téléphonie mobile et Internet, sont utilisés dans trois filières agricoles différentes (Maraichage, Cacaoculture et Lait). La méthodologie de l'étude impliquera des enquêtes auprès des agriculteurs et l'évaluation d'impact de l'utilisation des outils numériques sur leurs revenus. Il est attendu une différence significative de revenus entre les ménages agricoles utilisant et n’utilisant pas les outils numériques, une augmentation des revenus liée à l'usage de ces outils, et l'identification d'inégalités liées au genre, aux générations, aux zones géographiques et aux filières agricoles. L'étude visera à fournir des informations cruciales pour les décideurs politiques et les acteurs du développement afin d'optimiser l'adoption des outils numériques tout en atténuant les inégalités dans le secteur agricole ouest-africain.

Date de modification : 10 septembre 2024 | Date de création : 17 avril 2023 | Rédaction : GL