Les offres de stages #DigitAg 2023

#DigitAg finance des stages de Master 2 ou grade Master recherche équivalent (ingénieur fin d’études à vocation recherche, étudiant étranger…)

Pour 2023, des sujets de différentes disciplines sont proposés en Mathématiques et leurs applications, Sciences de la vie et de l’environnement, Sciences Humaines et Sociales  comme en Sciences pour l’Ingénieur

>Candidater directement auprès du responsable indiqué en contact du sujet choisi

Mathématiques et leurs applications

Pas de sujet disponible pour l’instant

Sciences de la Vie et de l’Environnement

Mieux comprendre les usages de l’eau dans des exploitations agroécologiques en Occitanie : évaluation de capteurs low-tech existants et application au suivi des pratiques d’irrigation

Mots-clé: low cost, low tech, capteurs, humidité du sol, compteur d’eau, irrigation

  • Discipline secondaire: Physique et Sciences de l’Univers (Préciser (ex: optique, sciences du sol, hydrologie…), hydrologie, sciences du sol, physique des écoulements
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: Mar 1, 2023
  • Unité de recherche: G-eau, Institut Agro
  • Contact: Belaud – gilles.belaud [AT] supagro.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données, Axe 2 : Innovations en agriculture numérique, Challenge 1 : Le challenge agroécologique, Challenge 6 : La gestion des territoires agricoles

En Occitanie, l’eau est une ressource critique pour l’agriculture. Le changement climatique renforce cet état de fait. En permettant de réduire le stress hydrique des cultures, l’irrigation fait partie des moyens d’adaptation possibles et peut constituer un levier important de transition agroécologique. Au sein d’exploitations déjà engagées en agroécologie et irriguées, une meilleure connaissance de la gestion de l’eau et de l’irrigation à l’échelle de l’exploitation est nécessaire. Le projet TAI-OC vise à caractériser les systèmes agroécologiques irrigués d’Occitanie, à comprendre les facteurs de la transition agroécologique et à accompagner cette transition. Pour comprendre ces systèmes, notamment en termes d’utilisation de l’eau, nous souhaitons nous appuyer sur les développements, initiés dans le cadre d’un projet européen (www.prima-hubis.org), d’un ensemble de solutions techniques à base de capteurs low-tech et à bas coût. Ces solutions permettent de mieux comprendre le pilotage de l’irrigation au sein des exploitations.

Le stagiaire aura pour objectif d’évaluer l’intérêt de capteurs de ce type pour le suivi et le pilotage de l’irrigation dans des exploitations agroécologiques. Pour cela, plusieurs sous-objectifs sont définis :

1/ état des lieux sur les capteurs low-tech low-cost disponibles sur le marché, concernant les capacités de mesure du volume d’irrigation et de pression dans des systèmes irrigués (conduits, canaux).

2/ évaluer leur utilisabilité (sur des critères économiques et end-user : coût, disponibilité, facilité d’utilisation mais aussi techniques : fiabilité en termes de mesures et incertitudes, nombre et type de pannes, possibilité de construction et réparation).

3/ analyser l’intérêt et l’opérationnalité de leur utilisation dans des exploitations agroécologiques (positionnement, nombre à utiliser, etc.) grâce à de la modélisation de réseaux d’irrigation.

Modéliser les stratégies collectives de coopération culture-élevage sur des territoires avec des troupeaux ovins mobiles

Mots-clé: modèle multi-agent ; viti-pastoralisme ; culture-élevage ; berger sans terre ; agroécologie

  • Discipline secondaire: Sciences pour l’Ingénieur
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1er mars 2023
  • Unité de recherche: Agir, Inrae
  • Contact: Myriam Grillot – myriam.grillot [at] inrae.fr
  • #DigitAg: Axe 6 : Modélisation et simulation (systèmes de production agricole), Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Challenge 6 : La gestion des territoires agricoles, Challenge 1 : Le challenge agroécologique, Challenge 4 : Des productions animales durables

Dans le cadre du projet de recherche Sagiterres, des modèles d’agroécologie innovants ont été identifiés dans le Minervois. Ils intègrent agriculture et élevage dans des systèmes de grandes cultures en agriculture biologique, de viticulture et d’élevage.

L’élevage y a un rôle de pivot (entretien de l’espace, apport de matière organique, etc.). Mais, son maintien pose des questions d’accès aux ressources fourragères et pastorales, et sur la circulation des animaux sur le territoire.

L’hypothèse faite est que le territoire a des ressources qui pourraient être ouvertes aux troupeaux et qu’il est possible de mieux coordonner les bergers avec les différents acteurs du territoire (viticulteurs, céréaliers, communes, gestionnaires forestiers, etc.) pour ajuster le niveau de chargement animal avec les ressources alimentaires disponibles.

Un modèle multi-agents spatialisé est développé spécifiquement dans le cadre du projet pour représenter le territoire dans son fonctionnement actuel. Il intègre les logiques des acteurs concernés, les ressources potentielles (couverts végétaux, inter-rangs des vignes, friches, etc.), les besoins en alimentation des troupeaux et éléments logistiques en lien avec la gestion de l’espace.

La personne recrutée pour ce stage explorera le modèle et l’utilisera pour simuler des scénarios permettant de renforcer, pérenniser, voir démultiplier les initiatives identifiées. Les scénarios pourront se baser sur les ateliers participatifs menés dans le cadre de l’utilisation du jeu sérieux Dynamix.

Les principaux résultats des simulations lui permettront d’évaluer les scénarios de fonctionnement des initiatives et d’accès aux ressources en termes de services rendus sur le territoire. Les résultats serviront de support de discussion sur les perspectives d’un déploiement réel de telles initiatives sur le territoire et pour impliquer des acteurs territoriaux et services publics.

Se regrouper quand il fait chaud ? Étude du comportement de “chôme” chez les ovins

Mots-clé: Comportement collectif, chôme, stress thermique, bien-être animal, capteurs numériques embarqués

  • Discipline secondaire: Sciences pour l’Ingénieur
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 20 février 2023
  • Unité de recherche: Centre de Recherches sur la Cognition Animale, Université Toulouse III – Paul Sabatier
  • Contact: Bon Richard – richard.bon [AT] univ-tlse3.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données, Axe 2 : Innovations en agriculture numérique, Challenge 4 : Des productions animales durables, Challenge 1 : Le challenge agroécologique

Chez les ovins au pâturage, le comportement dit de chôme est un comportement collectif d’agrégation des individus lié à la chaleur environnementale. Au cours de l’expression de ce comportement, qui peut durer plusieurs heures en cas de fortes chaleurs, le groupe n’ingère plus. Les dynamiques collectives associées à l’expression de ce comportement, leurs liens avec la température environnementale et l’intérêt individuel ou collectif de l’expression de ce comportement sont mal déterminés.
Pourtant ce comportement est au cœur des stratégies de pilotage des déplacements du troupeau par les bergers, peut représenter un frein aux performances du troupeau et est un enjeu de gestion du bien-être animal dans sa composante comportementale. L’évolution globale du climat et la multiplication des épisodes de chaleurs caniculaires dans le pourtour méditerranéen accentuent le besoin d’études de ce comportement afin de le comprendre et proposer des moyens de gestion de l’environnement de pâturage qui respectent les besoins comportementaux individuels et collectifs.
Dans cet objectif, pour ce premier projet nous visons, par l’utilisation d’outils numériques dédiés, à caractériser d’une part (i) les dynamiques collectives de regroupement (transmetteurs radio et capteurs ultra wideband embarqués) et d’autre part (ii) les conditions d’ambiance au sein de ces regroupements animaux (capteurs de température et de teneurs en gaz type CO2 et O2), en lien avec les conditions climatiques locales (capteurs de température, humidité et rayonnement solaire). Ces suivis seront réalisés au sein différents groupes de brebis (5 à 15 individus) du Domaine du Merle (Institut Agro Montpellier, Salon-de-Provence). Ils seront complétés par un suivi comportemental et sanitaire du troupeau notamment en lien avec des mesures du niveau de stress oxydatif dosage de métabolites plasmatiques.
Ce projet représente une opportunité de formalisation d’une collaboration entre les équipes du CRCA et de l’UMR SELMET.

Sciences pour l’Ingénieur

Comment le mouvement et/ou la posture d’un animal influence les mesures dans un système de captation de données basé sur de l’imagerie 3D ?

Mots-clé: imagerie 3D; posture ; modélisation squelettique ; correction

  • Discipline secondaire: Sciences pour l’Ingénieur ( (ex : automatique, informatique, IA, traitement des images, génie des procédés, télédétection…)
  • Durée souhaitée du stage (nombre de mois): 6 + 2 mois CDD (voir dernière partie)
  • Date de début du stage: Feb 15, 2023
  • Unité de recherche: UMR PEGASE, INRAE
  • Contact: Le Cozler Yannick – yannick.lecozler [AT] agrocampus-ouest.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données, Challenge 1 : Le challenge agroécologique, Challenge 2 : Le phénotypage rapide, Challenge 4 : Des productions animales durables

L’imagerie 3D permet de réaliser des mesures précises de morphologie sur animaux et de suivre leurs évolutions au cours du temps, en minimisant les risques liés à la manipulation, tant pour les personnes que pour les animaux. Le dispositif Morpho3D a montré qu’il était aussi possible d’estimer le volume, la surface, le poids ou la composition chimique à partir d’images 3D sur animaux vivants. La répétabilité et la reproductibilité des mesures sont bonnes, mais de fortes variations sur certaines mesures sont parfois observées, liées, semble-t-il, à la position de l’animal. Bien positionner l’animal nécessiterait toutefois une intervention humaine ou mettre en place des dispositifs contraignants, à l’encontre des objectifs recherchés de phénotypage à haut débit. Cette posture de référence permettrait au final de limiter, voire de corriger, les erreurs lors de certaines acquisitions. Ce travail sera réalisé à partir des données collectées au sein des installations expérimentales de l’UMR PEGASE. Il visera à déterminer la posture de référence des animaux et les approches à envisager lorsque l’image obtenue s’éloigne de celle désirée. Une de nos hypothèses est qu’il est possible, à partir de repères morphologiques, de modéliser un animal sous forme de squelette avec arbre de repères. Les articulations vues comme des liaisons rotules et la longueur des segments du squelette étant constante pour un animal donné, on peut ainsi définir sa position et son orientation globale dans le monde 3D et déterminer la posture de référence. Pour cela, les repères morphologiques d’intérêt seront précisés, pour définir la position statique de référence, validée par expertise. Nous faisons l’hypothèse qu’il sera ensuite possible, au besoin, de corriger les enregistrements, à partir d’une base de données références (référence et corrections associées), créée à partir d’un nombre limité d’animaux, de développement et gabarit différents, avec des postures très différentes.

Caractérisation du potentiel des espaces pastoraux méditerranéens par télédétection et multiusage des territoires

Mots-clé: pastoralisme, multiusage, télédetection, diversité

  • Discipline secondaire: Sciences de la Vie et de l’Environnement (ex : Ecologie, Agronomie, Sciences de l’environnement…)
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: Feb 1, 2022
  • Unité de recherche: UMR SELMET, INRAE
  • Contact: Fabien Stark – fabien.stark [AT] inrae.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données, Axe 6 : Modélisation et simulation (systèmes de production agricole), Challenge 4 : Des productions animales durables, Challenge 1 : Le challenge agroécologique
  • Challenge 6 : La gestion des territoires agricoles

Les surfaces pastorales représentent 2,2 millions d’hectares en France (RPG, 2018). Derrière cette classification, il existe toute une diversité de milieux et de couverts végétaux (Nozières et al., 2021). Ces surfaces pastorales font l’objet de différents usages : production agricole et forestière, ouverture des milieux, préservation de la biodiversité, activités récréatives. Pour s’assurer de la multifonctionnalité offerte par ces espaces naturels, il est nécessaire de pouvoir les caractériser finement, dans l’espace et dans le temps.

Pour répondre à cette problématique, la télédétection apparait comme un outil prometteur. En effet, les données d’imagerie satellitaires permettraient d’identifier les unités spatiales pastorales et leur agencement dans des mosaïques paysagères diversifiées. De plus, les images satellite multi-spectrale telles que (SPOT 6/7 et Sentinel) pourraient être mobilisées pour caractériser cette fois-ci le potentiel de biomasse des différents types de couverts végétaux présents (Dusseux et al., 2014). Finalement, la caractérisation des surfaces pastorales et de leur potentialité permettraient de favoriser tout un ensemble d’usage de ces milieux par les acteurs, en fonction de leurs caractéristiques.

Le stage proposé vise à développer une méthode de caractérisation les ressources pastorales disponibles (spatiale, temporelle et quantitative) par la télédétection. Pour ce faire, il s’appuiera sur une étude de cas (Minervois) où la question de la réintroduction de l’élevage de type pastoral est vue comme un levier agroécologique d’intérêt, en termes de recyclage des nutriments et transfert de fertilité, d’ouverture des milieux, d’entretien des parcelles viticoles, de lutte contre les incendies. Sur cette base il s’agira de calibrer un modèle générique d’estimation des potentialités offertes par les espaces pastoraux, de leurs usages possibles, remobilisable dans d’autres territoires et à d’autres échelles pour accompagner les acteurs.

Caractérisation de la VULNérabilité des plantations de CAFé à l’aide d’images satellites et de réseau de neurones (VULNCAF)

Mots-clé: Café, biodiversité, réseau de neurones, images satellites, maladies, ravageurs, indicateurs paysagers, paysage, texture

  • Discipline secondaire: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1er mars 2023
  • Unité de recherche: Amap, Cirad
  • Contact: Frédéric Borne – frederic.borne [AT] cirad.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Challenge 1 : Le challenge agroécologique, Challenge 3 : La protection des cultures, Challenge 6 : La gestion des territoires agricoles

L’objectif du stage est de caractériser la vulnérabilité des paysages caféiers face aux maladies et ravageurs (M&R), à partir d’images satellites (Pléiades-THRS, WV2) combinées à des jeux de données exogènes (pédologie, climat…). Nous proposons de tester ici l’approche par réseau de neurones « Swin Transformer ». Les délivrables attendus sont: 1) une cartographie du niveau de résistance à la propagation des M&R de la zone du projet, 2) une typologie de la résistance aux M&R, traduite en variables de surface.
La mission du stagiaire sera de construire un algorithme de traitement des images adapté à cette problématique. Son travail reposera sur des données de référence recueillies sur le terrain dans le cadre du projet DESIRA Robust en Ouganda, par une large équipe de chercheurs pluridisciplinaires. Ce contexte permettra de créer une base de données précise, étendue géographiquement, et d’une bonne représentativité, aspect souvent limitant pour la mise en œuvre des approches réseau.
Un grand nombre de parcelles de référence (>50 par type) sera ainsi identifié, caractéristiques et représentatives de la diversité de structure et de densité de plantation des caféiers (type d’ombrage, diversité, organisation…), et reflétant différents degrés de vulnérabilité aux M&R. Elles seront divisées en 3 jeux: un pour entraîner et « fine tuner » le réseau de neurones, un pour le tester et améliorer la qualité du résultat produit, un dernier pour cartographier toute la zone et évaluer le résultat final.
Différentes combinaisons de variables d’entrée seront donc étudiées pour déterminer les réseaux les plus performants selon les échelles: reconnaissance et typologie au niveau des vergers caféiers, puis aux niveaux inférieurs (structure intra parcellaire), en adaptant les résolutions des plans de données utilisés. On restituera ainsi, à chaque échelle d’étude, les paramètres les plus significatifs pour le réseau.

Navigation dans les règles d’implication multidimensionnelles sur l’agroécologie pour l’aide à la décision en santé animale et végétale

Mots-clé: Agroécologie, usage des plantes, Analyse de Concepts Formels, Règle d’implication multidimensionnelle, Analyse visuelle

  • Discipline secondaire: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1er février 2023
  • Unité de recherche: Lirmm, Université de Montpellier
  • Contact: Marianne Huchard – marianne.huchard [AT] lirmm.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 1 : Impact des technologies de l’information et de la communication sur le monde rural, Challenge 1 : Le challenge agroécologique, Challenge 3 : La protection des cultures

Pour un producteur agricole, décider d’une pratique impose de considérer celles mises en place afin d’éviter de perturber l’équilibre du système. Il doit donc connaître la diversité des situations culturales. Par exemple, la littérature présente diverses solutions à base de plantes pour contrôler l’infestation d’une culture agricole par une population de bioagresseurs. Choisir une solution qui la repousserait peut la faire migrer vers une culture avoisinante peu attaquée.
En comportant plus de 48000 descriptions d’utilisation de plantes à effet pesticide et antibiotique, la base Knomana [Silvie et al., 2021] peut permettre ce choix. Les plateformes logicielles RCAviz [Muller et al. 2022] et RCAvizIR permettent de naviguer dans cette base dont les connaissances ont été classées par l’Analyse de Concepts Relationnels. De façon à représenter fidèlement les données en plusieurs dimensions et faciliter leur interprétation par le producteur agricole, une solution consiste à les exprimer sous forme de règles d’implication multidimensionnelles, une méthode nouvelle issue de l’Analyse de Concepts Formels. Pour une relation ternaire connectant des bioagresseurs, des plantes qui les contrôlent et des cultures protégées, cette méthode permet par exemple d’énoncer les connaissances sous la forme « quand Bioag1 est contrôlé par plant1 sur culture1, alors Bioag1 est également contrôlé par plant2 sur culture1, et par plant3 sur culture2 ». Cette méthode se généralise à des relations de dimension supérieure à 3.
L’objectif du stage est de développer un prototype logiciel de visualisation de connaissances, exprimées sous forme de règles d’implication multidimensionnelles. Ces règles sont produites par un algorithme implémenté en Python. Nous développerons également une stratégie de présentation des règles à l’utilisateur incluant ses centres d’intérêt et d’après la sémantique du contenu des règles.

Estimation de traits de vigueur et de phénologie par analyse d’images pour le criblage de ressources génétiques fruitières

Mots-clé: imagerie RVB, apprentissage profond, estimation de traits, fruits à noyaux

  • Discipline secondaire: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1er février 2023
  • Unité de recherche: GAFL, Inrae
  • Contact: Morgane Roth – morgane.roth [AT] inrae.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données, Challenge 2 : Le phénotypage rapide, Challenge 1 : Le challenge agroécologique

L’arboriculture est un maillon essentiel de l’agriculture française contribuant à une alimentation saine et locale tout en permettant de diversifier les cultures et de stocker du carbone dans les sols. Cependant, ce secteur est fragile et en forte demande d’innovation variétale, notamment pour adapter les variétés au changement climatique et à la réduction des pesticides. Un enjeu important pour y parvenir est de proposer des solutions innovantes pour un phénotypage rapide et précis des ressources génétiques fruitières, enjeu auquel ce stage ambitionne de contribuer grâce à l’imagerie RVB (rouge vert bleu). Le projet vise à mettre au point des méthodes d’analyses d’images, combinant apprentissage profond, morphologie mathématique et stéréovision, pour extraire des traits de vigueur, de phénologie et d’activité photosynthétique chez le pêcher et l’abricotier. Les images seront acquises à l’aide de deux caméras RVB embarquées sur le système de phénotypage léger PHENOMAN dans des vergers à forte diversité génétique de plusieurs centaines d’arbres, et accompagnées de mesures de routine (visuelles/manuelles) des traits ciblés. Ceci viendra alimenter une base de données existante grâce à laquelle l’étudiant·e développera des algorithmes pour quantifier:
– L’évolution du volume du tronc et de la teneur en chlorophylle des arbres au cours de la saison, fonctions de la vigueur et de l’état de santé de l’arbre,
– Le stade de floraison et la densité florale qui sont déterminants pour l’adaptation au terroir et le rendement.
L’étudiant·e devra améliorer les méthodes d’estimation existantes pour les traits de croissance et de floraison, et concernant les traits liés à la chlorophylle, mettre au point les tout premiers protocoles d’acquisition (mesures SPAD, photos RVB) et de traitement de données. L’objectif à l’issue de ce stage est d’obtenir des outils fiables permettant de phénotyper efficacement les traits ciblés en routine dans les équipes de recherche voire en sélection.

Visualisation de services écosystémiques pour accompagner la conception de systèmes agroforestiers

Mots-clé: Interface Homme-Machine, Visualisation, Agroforesterie

  • Disciplines secondaires: Sciences de la Vie et de l’Environnement, Sciences Humaines et Sociales
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1er mars 2023
  • Unité de recherche: AbSyS, Inrae
  • Contact: Laëtitia Lemière – laetitia.lemiere [AT] inrae.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 6 : Modélisation et simulation (systèmes de production agricole), Challenge 1 : Le challenge agroécologique, Challenge 5 : Les services de conseil agricole

L’agroforesterie est un mode d’exploitation prometteur dans le cadre de la transition agroécologique. Toutefois, du fait de leur grande diversité, la conception de ces systèmes est complexe et nécessite de combiner des expertises multiples. Pour faciliter le choix des espèces et leur agencement spatial lors d’ateliers de conception collectifs, on utilise couramment des maquettes pour représenter la parcelle à concevoir. Toutefois il est difficile de se projeter dans le temps et l’espace à l’aide d’une simple maquette. Des visualisations en réalité augmentée pourraient permettre de représenter les fonctions et services écosystémiques produits par la parcelle agroforestière. Plusieurs visualisations sont possibles (objets 3D, layers avec transparence, texte…) et elles ont des avantages et des inconvénients propres.
Le but du travail de stage est de déterminer les visualisations les plus adaptées au contexte technologique (réalité augmentée), applicatif (maquette agroforestière) et d’utilisation (ateliers de co-conception). Cette problématique d’interaction homme-machine sera abordée par l’implémentation de plusieurs exemples de visualisations et leur évaluation auprès des utilisateurs ciblés par l’outil. Un prototype permettant de visualiser des systèmes agroforestiers en réalité augmentée a déjà été développé ; il permet pour l’instant de visualiser la croissance des arbres, l’ombrage instantané, les structures géométriques telles que les lignes d’arbres ou les surfaces occupées par les cultures. L’étudiant complètera ce prototype en ajoutant un module de visualisation de services écosystémiques. Le test de l’outil sera réalisé auprès de conseillers agroforestiers.

Normalisation automatique de variables issues de bases de données en agroécologie

Mots-clé: Science des données, fouille de texte, base de données, agroécologie, sémantique

  • Discipline secondaire: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: à définir
  • Unité de recherche: Aïda, Cirad
  • Contact: Sandrine Auzoux – sandrine.auzoux [AT] cirad.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 4 : Système d’information, stockage et transfert de données, Axe 6 : Modélisation et simulation (systèmes de production agricole)

Les étude agro-écologiques génèrent de nombreuses bases de données hétérogènes en terme de structure et de contenus. Elles sont difficilement exploitables et nécessitent une curation pour être mobilisées dans des approches statistiques ou de modélisation. La curation consiste à sélectionner les données les plus pertinentes et les enrichir de métadonnées nécessaires à leur compréhension, pour pouvoir les rendre accessibles, partageables et réutilisables. Pour annoter les données et augmenter la précision des termes utilisés, un collectif interdisciplinaire de chercheurs du CIRAD a construit un dictionnaire des variables. Une variable est constituée de termes sémantiques issus des connaissances expertes et d’ontologies de référence. Une liste de variables usuelles a été définie facilitant la comparaison et l’analyse des données, et les liens avec les modèles de culture.
L’objectif de ce stage est d’automatiser la labellisation des variables issues des bases de données en agro-écologie à partir de la liste des variables usuelles .
Le stagiaire utilisera les données provenant d’essais agro-écologiques mis en place à La Réunion par le CIRAD et ses partenaires (eRcane et CTIS).
Plusieurs méthodes seront mobilisées et combinées pour proposer les variables du dictionnaire les plus en phase avec les variables des bases de données:
– des mesures de proximités lexicales,
– des méthodes de proximités contextuelles fondées sur la description des variables données par les experts,
– des méthodes de proximités contextuelles fondées sur des corpus. Des contextes seront constitués à partir de corpus textuels et de méthodes de plongements de mots (word embedding) issues des méthodes d’apprentissage profond.
Au-delà d’une extension de la méthode en proposant des méthodes originales de fouille de texte, un objectif important de ce stage consiste à proposer une approche générique pour labelliser les données et faciliter l’interopérabilité des bases de données en agroécologie.

Transfert temporelle de modèle de cartographie d’occupation du sol à partir d’imagerie multi-source/multi-échelle en réutilisent de données terrain acquises dans le passé

Mots-clé: Télédétection, Agriculture, Machine Learning, Cartographie de l’occupation du sol

  • Discipline secondaire: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 3 avril 2023
  • Unité de recherche: Tetis, Inrae
  • Contact: Dino Ienco – dino.ienco [AT] inrae.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 4 : Système d’information, stockage et transfert de données, Challenge 6 : La gestion des territoires agricoles, Challenge 8 : Développement agricole au Sud

De nos jours, de plus en plus de données satellitaires sont accessible, offrant la possibilité de suivre une zone géographique dans le temps. Les séries temporelles ainsi générées représentent une source d’information incontournable pour gérer de manière efficiente notre agriculture à l’échelle territoriale.
À cette fin, les données satellitaires sont utilisées en d’entrée à des méthodes d’apprentissage automatique (ML) pour fournir des cartes d’occupation du sol (COS) actualisées. Pour cela, les méthodes ML nécessitent d’une grande quantité de vérité terrain, ce qui pose des défis à leur utilisation où peu ou pas de données de référence est disponible. Par exemple, lorsqu’une COS doit être mise à jour d’une année à l’autre.
Réutiliser des données de vérité acquises par le passé pour transférer un modèle à une période successive permettra d’éviter des nouveaux coûts et capitaliser sur les investissements faits par avant. Malheureusement, transférer directement un modèle d’une année à une suivante peut être inefficace puisque les deux périodes sont affectées par des conditions environnementales et/ou climatiques différentes. Il en résulte des différences dans la distribution des données satellitaires acquises.
La présente proposition de stage vise à développer une méthode innovante d’apprentissage profond/apprentissage par transfert pour produire une COS d’une année T en utilisant les données satellitaires sur l’année T ainsi que de données de vérité précédents (i.e. année T-1). Nous allons nous attaquer à un cadre multi-source où l’entrée sera constituée d’imagerie multi-temporelle Sentinel-2 et imagerie SPOT6/7 avec la question de comment fusionner ces données hétérogènes (en résolution spatiale et contenu spectrale). Les images satellitaires seront obtenues à travers les plateformes THEIA et PEPS et l’Equipex GEOSUD (DINAMIS). La méthode développée sera évaluée sur un site d’étude en Afrique de l’Ouest au Burkina-Faso et caractérisée par une agriculture paysanne.

Gestion et analyse des métadonnées et du niveau de FAIRness des ressources hébergées sur AgroPortal

Mots-clé: Ressources sémantiques (ontologies, vocabulaires, thésaurus, terminologies), Technologies du web sémantique (RDFS, OWL, SKOS), Standard de métadonnées, JSON, XML, curation de métadonnées, principes FAIR, FAIRness assessment

  • Disciplines secondaires: Sciences de la Vie et de l’Environnement
  • Durée souhaitée du stage (nombre de mois): 6 à 9 mois
  • Date de début du stage: 1er novembre 2022
  • Unité de recherche: Mistea, Inrae
  • Contact: Clément Jonquet – clement.jonquet [AT] inrae.fr
  • #DigitAg: Axe 4 : Système d’information, stockage et transfert de données, Challenge 0 : sujet transversal

Les ressources sémantiques (e.g., thesaurus, terminologies, vocabulaires et ontologies) sont des éléments clés pour assurer l’interopérabilité des données. Dans certains domaines de recherche en agronomie (e.g., phenotypage), les scientifiques développent déjà des ressources sémantiques pour faciliter l’intégration de leurs données avec d’autres et permettre l’extraction de connaissances e.g., Crop Ontology, Plant Ontology, Food Ontology, Irrigation Ontology).
Le projet ANR D2KAB (www.d2kab.org), démarré en 2019, D2KAB développe et maintient AgroPortal (http://agroportal.lirmm.fr), un portail de ressources sémantiques pour l’agronomie et l’agriculture qui permet aux acteurs de la communauté scientifique (mais pas seulement) de partager leurs ontologies.
Les principes “FAIR” définissent un ensemble de caractéristiques que les données et leurs métadonnées devraient présenter pour être Faciles à trouver, Accessibles, Interopérables et Réutilisables. Également, suivant le principe I2, une ontologie, et plus généralement une ressource sémantique, devrait aussi être “FAIR”.
Nous avons développé une méthode de « FAIRness assessment » (évaluation du niveau de respect des principes FAIR) qui se base sur les propriétés des métadonnées des ontologies pour déterminer un score de FAIRness (travail en cours de publication). Nous avons implémenté en partie cette méthodologie dans AgroPortal.
L’objectif de ce stage est de s’approprier l’état de l’art des différents outils et approches existant sur le FAIRness assessment pour les ontologies et de mener une étude comparative des outils (automatique) et des méthodes (manuelles) de FAIRness assessment sur les ressources hébergées dans AgroPortal. Il s’agira de de faire un état des lieux sur leurs métadonnées descriptives et de leur niveau de FAIRness ; puis de mettre en place et documenter des procédures de gestion et curation des métadonnées des ressources sémantiques hébergées dans AgroPortal.

Sciences Humaines et Sociales

 Pas de sujet disponible pour l’instant