Les offres de stages #DigitAg

#DigitAg finance des stages de Master 2

ou grade Master recherche équivalent (ingénieur fin d’études à vocation recherche, étudiant étranger…)

 

Ces stages se déroulent dans les laboratoires des unités de recherche membres (INRAE, Inria, Cirad, Université de Montpellier, Institut Agro-Montpellier SupAgro, AgroParisTech), principalement à Montpellier, mais ils peuvent aussi aussi être localisés à Toulouse, Avignon ou Rennes, voire à l’étranger.

Pour 2021, des sujets de différentes disciplines sont proposés en Mathématiques et leurs applications, Sciences de la vie et de l’environnement, Sciences Humaines et Sociales  comme en Sciences pour l’Ingénieur

>Télécharger toutes les offres de stage

>Candidater directement auprès du responsable indiqué en contact du sujet choisi

Mathématiques et leurs applications

Estimation de la surface foliaire de mélanges de plantes par analyse d’image.

Mots-clé: analyse d’image, phénotypage, cultures associées, stress hydrique

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/02/2021
  • Unité de recherche: AGIR, Inrae
  • Contact: Casadebaig Pierre : casadebaig@inrae.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 1 :  Le challenge agroécologique, Challenge 2 :  Le phénotypage rapide

L’utilisation de la diversité végétale cultivée émerge comme l’un des leviers pour s’orienter vers une agriculture durable. En effet, la diversité d’une communauté végétale naturelle augmente et stabilise la production primaire via des effets de complémentarité entre plantes. Pour l’agriculture, l’enjeu actuel est de déterminer quels mélanges d’espèces améliorent la performance du couvert via une meilleure utilisation des ressources environnementales disponibles.

Si la physiologie des plantes cultivées en monoculture est de mieux en mieux connue, le fonctionnement d’un couvert en mélange reste peu étudié. Dans cette étude, nous nous focaliserons sur les processus de croissance en surface et sur la consommation d’eau d’un couvert en mélange en mobilisant des méthodes d’analyse d’images.

L’objectif finalisé de cette étude est de déterminer dans quelle mesure un mélange affecte la consommation en eau d’un couvert par rapport aux comportements des plantes en culture pure. Ce travail comporte une importante phase de développement méthodologique, visant à développer une méthode pour estimer la croissance de la surface foliaire de plantes en culture pure et en mélange, plusieurs fois par semaine, à l’aide d’images acquises automatiquement par un robot de culture.

Les données nécessaires au développement de cette méthode seront issues d’une expérimentation en conditions contrôlées, qui sera conduite lors de l’étude. Nous nous appuierons sur une plateforme de phénotypage haut-débit (Heliaphen, INRAE TPMP), où un robot permet de piloter la culture de plantes en pot et d’acquérir automatiquement des données d’imagerie et de consommation en eau.

Nous nous focaliserons sur deux espèces (blé et pois) cultivées seules ou en mélange (trois combinaisons) et deux scénarios d’irrigation (bien irrigué et dessèchement).

Quatre grandes étapes de travail sont proposées : (1) extraire des caractéristiques fonctionnelles des plantes depuis des images acquises quotidiennement ; (2) compléter ces données par des mesures manuelles de surface des plantes utilisées comme vérité terrain ; (3) développer et évaluer la performance d’un modèle qui prédit la surface des plantes à partir de caractéristiques extraites des images ; et (4) analyser les données pour comparer la consommation en eau des mélanges et de leurs composantes en culture pure.

Construire la décision pour optimiser le contrôle des adventices

Mots-clé: Fouille de données, apprentissage machine, adventices, tropical, agroécologie, système expert, aide à la décision

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 3/02/2021
  • Unité de recherche: AIDA, Cirad
  • Contact: Auzoux Sandrine : auzoux@cirad.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 1 :  Le challenge agroécologique, Challenge 3 :  La protection des  cultures,Challenge 8 :  Développement agricole au Sud

Les adventices sont une contrainte majeure pour la production agricole tropicale, induisant des pertes de rendement de 30 à 80%. L’optimisation des pratiques de désherbage dans les itinéraires techniques nécessite une bonne connaissance de leur comportement, notamment dans un contexte de réduction de l’utilisation des herbicides. Ce stage s’intègre dans une initiative de recherche collaborative proposant de combiner des approches relatives à la science des données et des connaissances de terrain issues d’essais expérimentaux en agro-écologie. L’objectif du stage est de construire un outil d’aide à la décision pour les agriculteurs, permettant d’optimiser les pratiques de gestion des adventices en fonction de facteurs pédoclimatiques, de l’itinéraire technique en culture de canne à sucre et des connaissances sur le cycle de vie des adventices sur l’île de La Réunion.

Ce travail s’appuiera sur un grand volume de données (relevés floristiques, facteurs de milieux, taxonomie, et la phénologie des espèces adventices) qui a été publié sur le dataverse du CIRAD sous forme de fichiers standardisés du point de vue syntaxique, sémantique et structurel.

La construction de l’outil d’aide à la décision reposera sur 3 étapes :

  1. Prévoir l’influence des facteurs agronomiques et écologiques sur la présence et l’abondance des adventices.

En se fondant sur les 1341 relevés réalisés sur La Réunion et les 300 taxons observés, une méthode d’apprentissage machine permettant de prédire la probabilité de présence et d’abondance des différentes espèces adventices sera développée. L’abondance des espèces dans une parcelle sera prédite en fonction de facteurs facilement renseignables par les agriculteurs, tels que la localisation, le type de sol, l’altitude, la pluviométrie, la saison d’intervention ainsi que l’itinéraire technique de la culture.

  1. Prévoir l’agressivité des adventices en tenant compte de leur phénologie.

En se fondant sur l’expertise des malherbologues du CIRAD, les prédictions d’abondance de l’étape 1 seront combinées à des indices d’agressivité pour chaque espèce afin d’estimer la nuisibilité potentielle des adventices dans la parcelle considérée. De plus, en intégrant les données sur les suivis phénologiques des espèces (levée, floraison) elles-mêmes liées aux facteurs pédoclimatiques précédents, une plage d’intervention optimale d’intervention sera définie et des choix techniques d’intervention seront recommandés pour une mise en œuvre de pratiques de gestion de la flore adventice

  1. Conseiller les moyens de lutte les plus appropriés

En tenant compte de l’abondance prédite des espèces, de la plage d’intervention et de l’itinéraire technique, ainsi que de l’expertise des chercheurs locaux, un système de décision-expert sera construit pour proposer les méthodes de luttes les plus appropriées (méthodes alternatives aux herbicides ou application optimisée des herbicides) au contexte agroécologique et en fonction des possibilités techniques de l’agriculteur.

Cet outil d’aide à la décision sera développé dans le contexte réunionnais et pour la culture de la canne à sucre, mais de façon suffisamment générique pour permettre un re-paramétrage pour d’autres systèmes de cultures, d’autres territoires et d’autres climats. Ainsi, il sera envisageable de proposer des pratiques de désherbage adaptées en fonction d’un type d’enherbement prédit, en un lieu donné, à une date donnée, pour un système de culture donné.

Comparaison de mesures de sensibilité communes pour l’évaluation d’un modèle de culture multi-échelle

Mots-clés : Modèle spatial des cultures, indices sobols, variabilité spatiale

  • Durée / date de démarrage souhaitée : 6 mois, 3/1/2020
  • Unités de recherche : Itap, Inrae
  • Contact : james.taylor[ AT] inrae.fr
  • #DigitAg : Axe 6 : Modélisation et simulation (systèmes de production agricole)- Challenge 3 :  La protection des  cultures,Challenge 5 :  Les services de conseil agricole

Les modèles de culture sont en train d’être ajustés pour accepter des données à haute résolution afin de fournir des prévisions en cours de saison à l’échelle de la ferme, du champ et du sous-champ, c’est-à-dire que les modèles et les données d’entrée deviennent de plus en plus scalaires par nature. Un projet récent (de Dr Taylor) a incorporé avec succès des images haute résolution d’UAV (et de leurs dérivés) dans un modèle bien connu de culture de pommes de terre. À l’aide de critères de modélisation très élémentaires, comme la RMSE, le projet a permis d’améliorer les prévisions lorsque les données d’imagerie des UAV étaient utilisées (par rapport au modèle original). Toutefois, plusieurs limites ont été relevées dans cette approche. Seules des prédictions à la même échelle peuvent être comparées, alors qu’une question clé est d’identifier l’échelle optimale (empreinte spatiale) pour faire fonctionner le modèle. mesure que l’empreinte de la modélisation change, l’influence des effets stochastiques sur le comportement du modèle changera (tant en ce qui concerne le gain d’information supplémentaire potentiel que l’augmentation potentielle du  » bruit « ). Il est essentiel d’en tenir compte pour déterminer une échelle de modélisation privilégiée (résultats) en présence d’intrants à différentes échelles. Dans le cadre du projet Tuberzone, une vaste base de données sur les cultures à l’échelle du point, de la zone et du champ est disponible pour permettre la modélisation des cultures à diverses échelles. Dans le cadre de ce projet de maîtrise, le modèle existant sera exécuté à diverses échelles et avec diverses échelles d’entrée (qui peuvent être ajustées en échelle par interpolation ou sous-échantillonnage). L’analyse de sensibilité fondée sur la variance, utilisant principalement des approches fondées sur Sobol, sera ensuite testée sur des permutations d’entrées et de sorties de modèles à l’échelle afin de comprendre dans quelle mesure ces analyses de sensibilité existantes permettent d’évaluer le comportement du modèle spatial des cultures. En particulier, un objectif clé est de commencer à comprendre comment les structures de variance spatiale, qui existent dans ces données, sont prises en compte (et pourraient potentiellement être mieux prises en compte). Ce projet de maîtrise sera axé sur l’application et la performance d’indices d’analyse de sensibilité à un modèle de culture spatialisé connu. Il n’est pas nécessaire de comprendre la mécanique du modèle de culture ou la phénologie/agronomie sous-jacente. Le critère clé est que l’étudiant soit capable de travailler dans l’espace (géo-) statistique. Un projet de doctorat qui élargit ces idées a été accepté par #DigitAg en 2019, mais malheureusement le candidat sélectionné a refusé l’offre. On espère que ce projet de maîtrise permettra d’identifier un étudiant qui pourrait éventuellement poursuivre des études supérieures dans ce domaine.

 

Etude des techniques de communication intracorporelle et sous-marine pour un réseau de capteurs implantés dans un poisson

Mots-clés : Aquaculture, pêche, dispositif électronique implanté, communication intra-corporelle, communication sous-marine

  • Durée / date de démarrage souhaitée : 6 mois, 2/1/2020
  • Unités de recherche : LIRMM, Université de Montpellier
  • Contact : kerzerho [AT] lirmm.fr
  • #DigitAg : Axe 2 : Innovations en agriculture numérique,Axe 3 : Capteurs, acquisition et gestion de données- Challenge 4 :  Des productions animales durables

Ces travaux se placent dans le cadre d’un projet à long terme ayant pour objectif le développement du premier réseau de capteurs implantés pour le suivi holistique de l’état de santé de poissons. Cette approche repose sur le besoin de mesurer des paramètres physiologiques à des endroits particuliers pour collecter des informations utiles sur différents processus biologiques. Par exemple, un capteur de pH ou de température dans l’estomac pour identifier les évènements d’alimentation, un capteur dans les zones de stockage des graisses afin de connaître l’énergie disponible pour une période de jeûne, un capteur dans les gonades pour identifier le cycle de développement ovocytaire sont des solutions utiles qui doivent être mises en réseau pour collecter un maximum d’informations sur l’individu.
La mise en place d’un réseau de capteurs sans-fils implantés chez l’animal a bien évidemment applicable à toute espèce animale exploitée. L’étude des poissons, aussi bien dans le cadre d’aquaculture que dans le cadre d’espèces sauvages exploitées est l’application particulière que nous visons. Dans le cas de poissons vivant dans l’eau salée, un problème majeur lié au déploiement d’un tel réseau de capteur est la communication nécessaire pour la récupération des données. Le tissu biologique est un milieu contraignant pour la mise en place de communications. De plus l’eau salée a pour particularité de très fortement atténuer l’amplitude des ondes électromagnétiques et donc de limiter la portée de communications radiofréquences généralement utilisées pour la mise en place de réseaux de capteurs.
L’objectif de ce stage est de mettre en œuvre et de tester différentes techniques de communication intracorporelle afin d’évaluer la possibilité de déploiement en milieu marin.
Les techniques de transmission intracorporelle se classent dans deux grandes catégories :
– Couplage galvanique : le tissu biologique est utilisé comme médium du signal
– Transmission RF : le tissu biologique est utilisé comme milieu de transmission
Des résultats préliminaires ont démontré la possibilité de réaliser des communications intracorporelles au travers de poissons immergés à l’aide du protocole LoRa avec portée d’au moins 1m dans l’eau.
Le cadre applicatif étant le déploiement dans des poissons potentiellement petits pour un suivi de longue durée, les deux critères majeurs sont l’encombrement et l’autonomie des dispositifs. Par conséquent la conception des différents systèmes de communication aura pour objectif de limiter l’encombrement notamment lié à la taille des antennes et des batteries. Les tests auront comme objectifs :
– Valider la mise en œuvre de la communication au travers de poissons immergés
– Éprouver la limite de portée des communications dans l’eau salée
– Mesurer la consommation des systèmes
– Calculer un indice d’efficacité énergétique de la communication afin de comparer les différentes techniques de communication et identifier la technique permettant la plus grande autonomie

Sciences de la Vie et de l’Environnement

Construction d’un outil de détection d’évènements à partir de données d’abreuvement de vaches laitières ou de truies

Mots-clé: élevage de précision, détection d’évènements, abreuvement, multi-espèces

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Pegase, Inrae
  • Contact: Boudon Anne : boudon@inrae.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 2 :  Le phénotypage rapide

Les outils d’élevage de précision peuvent permettre aujourd’hui un suivi individuel et automatisé des vaches laitières et des truies. Ce suivi, associé aux observations des éleveurs pourrait contribuer à une détection de plus en plus précoce d’un grand nombre d’évènements face auxquels une réponse de l’éleveur est nécessaire (chaleur, mise-bas, troubles sanitaires, disfonctionnement de matériels d’élevage). L’UMR PEGASE a validé, aussi bien sur des vaches laitières que sur des truies gestantes un dispositif de suivi individualisé du comportement d’abreuvement, consistant en des abreuvoirs connectés capables d’enregistrer les buvées et de les attribuer à chaque animal.

L’hypothèse centrale de ce projet est que les fortes variations d’abreuvement peuvent permettre de détecter des évènements sanitaires, de reproduction ou de disfonctionnement technique. Deux bases de données collectées à l’UMR PEGASE vont permettre de tester cette hypothèse. La base de donnée en vaches laitières est constituée de 2 ans de collecte de données d’abreuvement, de production laitière, de reproduction et d’évènements sanitaires, sur un troupeau de 162 vaches. La base de données en truies gestantes est constituée de données d’abreuvement, d’ingestion, d’évènements sanitaires collectées sur 60 truies aux cours de différents évènements induits de disfonctionnement techniques (fermeture d’un distributeur automatique de concentrés sur les deux présents dans une salle, variation de la température de la salle).

Ce stage sera réalisé à l’UMR PEGASE de l’INRAE et donnera lieu à un double encadrement par une chercheuse nutritionniste (Anne Boudon) et une chercheuse modélisatrice (Charlotte Gaillard). Il donnera aussi lieu à des échanges avec des chercheurs de l’UMR MoSAR. De fait, le comité de suivi du stage rassemblera à la fois des chercheurs compétents sur les régulations physiologiques de l’abreuvement et sur le traitement de données dynamiques en élevage.

Au début du stage, les bases de données seront disponibles ainsi qu’une première ébauche de programme de détection d’évènements. La première étape du stage va consister à vérifier et structurer les données, ainsi qu’à explorer et décrire la variabilité des données. La deuxième étape consistera à construire une démarche de détection d’évènements. La démarche pressentie à ce jour est d’utiliser une méthode de lissage différentielle, déjà mis en œuvre par l’UMR MoSAR, pour détecter des perturbations dans les dynamiques des signaux d’abreuvement. Ces perturbations seront alors comparées à la dynamique des évènements induits chez les truies et aux évènements enregistrés chez les vaches laitières. Cette méthode de détection des perturbations présente l’avantage a priori de son adaptabilité aux deux contextes très différents traités au cours de ce stage (vaches en lactation et truies gestantes). Ce stage devra aussi être une occasion de s’interroger sur d’autres démarches possibles, notamment par un échange avec l’unité Locadam de l’IRISA.

Suivi de l’évolution des réserves corporelles chez la génisse laitière: un outil de prévention des réformes précoces ?

stage pourvu

Mots-clé: réserves corporelles; imagerie 3D; réforme et bien-être; temps réel

  • Durée souhaitée du stage (nombre de mois): 6 + 2 mois CDD (voir dernière partie)
  • Date de début du stage: 15/02/2021
  • Unité de recherche: Pegase, Inrae
  • Contact: Le Cozler Yannick : lecozler@agrocampus-ouest.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données / Challenge 1 :  Le challenge agroécologique, Challenge 2 :  Le phénotypage rapide, Challenge 4 :  Des productions animales durables

Les génisses de renouvellement sont « les parents pauvres » de l’élevage laitier, car non productrices de lait et souvent élevées loin de l’exploitation. Pourtant, elles représentent la moitié des animaux présents dans un élevage et c’est durant la période d’élevage que se prépare leur carrière. Celle-ci ne sera optimale que si cette période d’élevage leur assure de bonnes conditions de croissance, de santé et de bien-être, estimables indirectement via l’évolution d’indicateurs tels que le poids vif (PV) ou le niveau de réserves corporelles. En France, près d’1/4 des génisses est réformé après le 1er vêlage, et malgré ce chiffre élevé, les causes ne sont pas connues et devraient faire l’objet de prochains travaux de thèse. Toutefois, l’importance des réserves corporelles chez la vache adulte laisse supposer que ce critère, notamment son évolution en cours de gestation, pourrait avoir une influence forte sur les risques de réforme précoce chez la primipare. A la différence des vaches, il n’existe pas de grille de note d’état corporel (NEC) chez la génisse, permettant d’estimer leur niveau de réserves. Des modèles de croissance basés sur le gain de PV ont ainsi été développés pour estimer le dépôt des tissus maigre et/ou gras. Mais la pesée est peu réalisée, car coûteuse et parfois dangereuse. Enfin, parce que la génisse est un animal en croissance ne produisant pas de lait, les cinétiques d’évolution du PV et de la NEC diffèrent de celles de la vache : il est possible d’observer chez la génisse un gain de PV concomitant à une perte de NEC, phénomène rarement noté chez la vache. L’analyse automatisée des images en 3D par apprentissage permet un suivi en temps réel de la NEC, estimée au niveau de la croupe chez la vache. Pour l’utiliser chez la génisse, en raison du développement précédemment évoqué, un tel apprentissage serait sans doute à reconsidérer. Mais pour une future utilisation large, les outils de captation doivent aussi être peu onéreux et facilement utilisables, se basant sur des capteurs dédiés à la reconnaissance d’environnement en 3D couplés, à terme, à un traitement automatisé et rapide de l’information. De tels dispositifs sont testés sur vaches adultes au sein des installations expérimentales de l’UMR PEGASE. Pour ce stage, une méthode d’analyse de mesures en continu et en temps réel de la NEC chez la génisse gestante sera mise au point, en s’appuyant sur l’expertise en cours de développement chez la vache adulte. Des mesures de NEC seront réalisées 3 fois/semaine, les animaux recevant deux régimes alimentaires distincts afin d’obtenir des NEC très différentes au vêlage. Outre l’analyse des performances des animaux, l’objectif sera de valider une méthode prenant en compte d’éventuelles données manquantes et/ou aberrantes, fréquentes en élevage commercial.

Sciences Humaines et Sociales 

Technologies numériques et économie circulaire : avancées et possibilités

Mots-clé: Technologies numériques, Economie circulaire, Chaîne de valeur des données

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Moisa, Inrae
  • Contact: Piot-Lepetit Isabelle : piot-lepetit@inrae.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique / Challenge 7 :  Intégration de l’agriculture dans les chaînes de valeur

L’usage du numérique dans les exploitations agricoles est censé permettre d’améliorer la productivité, la traçabilité, les conditions de travail et de vie des agriculteurs, mais aussi de limiter les impacts négatifs sur l’environnement et de lutter contre le changement climatique (FAO, 2013). Par ailleurs, les technologies numériques sont considérées comme pouvant accompagner et favoriser une transition vers l’économie circulaire ; cette dernière étant définie comme un système économique d’échange et de production qui, à tous les stades du cycle de vie des produits (biens et services), vise à augmenter l’efficacité de l’utilisation des ressources et à diminuer l’impact sur l’environnement tout en développant le bien être (Ademe, 2020).

En effet, les technologies numériques via la fourniture d’information sur la disponibilité, la localisation et l’état des produits peuvent soutenir le développement de procédés de production et de consommation qui minimisent les déchets, augmentent la durée de vie de certains produits et réduisent les coûts de transaction induits, qu’ils soient directs (frais financiers) ou indirects (temps et efforts demandés). En particulier, les technologies numériques sont pressenties comme pouvant aider à fermer la boucle de l’économie circulaire ou au moins à la diminuer afin de réduire l’impact sur l’environnement.

L’objet du stage est de faire un état des lieux des technologies numériques soutenant le développement de l’économie circulaire, en particulier (i) en questionnant leur intégration dans la chaîne de valeur des données (collection – intégration – analyse) et (ii) en caractérisant leur contribution au déploiement de plus de circularité. En plus de la description de l’existant, une attention particulière sera  portée aux challenges rencontrés par les acteurs concernés et aux besoins en termes de recherche pour lier technologies numériques et économie circulaire. Le livrable attendu est une revue de la littérature explorant ce qui se fait dans différents secteurs d’activité.

Afin de caractériser les éléments spécifiques au secteur agricole, des entretiens seront réalisés avec des acteurs développant et utilisant des technologies numériques à des fins de réduction de l’utilisation des ressources ou de mises en œuvre d’activités reposant sur un principe de circularité. Les acteurs interviewés seront sélectionnés sur la base du positionnement des technologies numériques utilisées dans la chaîne de valeur des données. Le livrable attendu présentera des exemples d’utilisation des technologies numériques à des fins de développement de l’économie circulaire dans le secteur agricole et une toute première synthèse des implications en termes de changement du système économique et des business modèles des acteurs concernés. Une attention particulière sera portée aux éléments concernant la création et le partage de données, la collection et l’intégration de ces données, l’analyse des données et l’utilisation des connaissances créées, mais aussi les besoins en infrastructure, collaborations et compétences.

Sciences pour l’Ingénieur

Phénotypage des cultures associées par capteurs de proxidétection

Mots-clé: Phénotypage ; Cultures associées ; deep learning

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Arvalis, Acta
  • Contact: Benoit de Solan : desolan@arvalis.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données / Challenge 1 :  Le challenge agroécologique, Challenge 2 :  Le phénotypage rapide

Les mélanges de cultures présentent des intérêts agronomiques nombreux : meilleure exploitation des ressources, meilleure tolérance aux stresses. Cependant, pour être bénéfiques, ils nécessitent une conduite culturale adéquate, adaptée aux conditions pédo-climatiques locales.

Afin de mieux aider les producteurs à choisir les espèces et à piloter leurs cultures, des mesures sont réalisées au cours de la saison afin de suivre le développement de la culture principales et des couverts associés. Ces données sont classiquement acquises à partir d’observations visuelles de terrain et de mesures destructives. Cependant, ces méthodes sont complexes, fastidieuses et souvent peu répétables car très hétérogènes spatialement. C’est pourquoi leur automatisation par capteurs est un enjeu fort pour accélérer les acquisitions et améliorer leur répétabilité.

En 2021, un essai comparant différentes modalités de cultures associées sera mis en place à Oraison (04). Il fera l’objet d’un suivi par des méthodes classiques (visuelles, destructives) et par un ensemble de techniques de phénotypage (drones, système portable) largement automatisés. Une activité d’appui auprès de l’équipe technique sera nécessaire pour s’assurer du bon déroulement de la saison. Une fois acquis et structuré, ce jeu de données sera utilisé pour le développement des méthodes de caractérisation des couverts associés ainsi qu’à leur validation, en lien avec les experts de l’UMT CAPTE. Plusieurs approches pourront être mises en œuvre et évaluées : quantification des fractions de couverture par deep learning (segmentation sémantique), caractérisation de la structure des cultures par analyse d’images de hauteur (stéréovision), analyse de la dynamique de croissance. Enfin, une comparaison des performances des différentes méthodes et outils sera établie.

Intégré(e) au sein de l’équipe Inrae – ARVALIS d’Avignon, le (la) stagiaire a en charge un projet Data complet : de l’acquisition à l’analyse les données dans les expérimentations mises en place. Les principales étapes sont les suivantes :

  • Participer à l’acquisition sur le terrain des mesures capteurs et des données de référence (mars -> juin) avec les capteurs développés par l’UMT CAPTE
  • Développer et comparer différents algorithmes, en lien avec l’équipe CAPTE. La robustesse des méthodes est un point essentiel.
  • Evaluer la qualité des estimations par le système, suivant les conditions d’utilisation et les méthodes
  • Rédiger le rapport de stage et préparation de la soutenance.

ARVALIS – Institut du végétal est un organisme de recherche appliquée en pointe sur l’analyse de données capteurs pour l’agriculture. Au sein de l’UMT CAPTE avec l’INRAE d’Avignon et la société HIPHEN, il développe des outils et des méthodes mettant en œuvre des capteurs (lidars, caméras, spectromètres, …) intégrés sur différents systèmes (robots, drones, capteurs sans fil, …).

Simulations distribuées de plantes: Application à l’agroécologie

Mots-clé: Modèle Structure-Fonction, Calcul distribué, Cluster de calcul, Peuplement, Agroforesterie.

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: AGAP, Cirad
  • Contact: Frédéric Boudon : boudon@cirad.fr
  • #DigitAg: Axe 6 : Modélisation et simulation (systèmes de production agricole) / Challenge 1 :  Le challenge agroécologique, Challenge 8 :  Développement agricole au Sud

Pour satisfaire les demandes sociétales pour une agriculture plus durable et écologique, des modèles de plantes simulant leurs croissances et leurs fonctionnements (FSPM) sont développés par la communauté scientifique. Dans le cadre de la plateforme de modélisation OpenAlea, nous développons depuis plusieurs années, différents formalismes de simulation (Pradal et al., 2008; Boudon et al., 2012). En particulier, des grammaires formelles, i.e. L-systems, permettant la réécriture efficace d’arborescences ou des méthodes de réécriture de graphes multi-échelles (MTG) sont disponibles et ont permis de modéliser une grande variété de plantes (pommier, manguier, palmier, maïs, sorgho, etc.).

Les modèles FSPM permettent d’étudier et d’analyser les interactions plante-plante dans des couverts complexes en association (Gaudio et al., 2019, Braghiere et al., 2020). Ils permettent de simuler la plasticité phénotypique aérienne et racinaire en prenant en compte la compétition pour la lumière et pour l’acquisition des ressources de façon mécaniste. Pour cela, il est cependant nécessaire de simuler, à l’échelle de l’organe et en 3D, le développement et le fonctionnement d’un grand nombre de plantes en interaction au sein d’un même couvert. Pour faire cela dans des temps raisonnables, il serait nécessaire de distribuer les calculs de simulation sur de grandes infrastructures de calcul (cluster, cloud). Or, actuellement, il n’existe pas ni de formalisme ni de technologie permettant de distribuer automatiquement la simulation 3D de plantes hétérogènes en interaction.

Le challenge auquel nous essayons de répondre est donc de simuler efficacement un ensemble de plantes en interaction spatiale (compétition pour l’acquisition des ressources) et temporelle (rétroaction entre la structure et la fonction). L’objectif de ce stage est d’analyser différentes stratégies de parallélisation pour simuler en 3D la croissance et le fonctionnement de plantes et peuplements sur des architectures à mémoire partagée et en environnement distribué (Pradal et al., 2017; Heidsieck et al., 2020). Un des enjeux est de définir des design patterns pour des calculs distribués à différentes granularités (simulation parallèle d’une plante isolée, calcul distribué d’un grand nombre de plantes en interaction) en utilisant les technologies actuelles (OpenMP, Spark, Dask). Un enjeu important est de prendre en compte les dépendances entre les calculs faits sur les structures lors de leurs réécritures en fonction des stratégies utilisées (en place ou par copie).

Une application de ce travail sera la simulation d’un système agroforestier mélangeant palmiers et riz pour lequel des modèles préexistants (projets VPalm et Cereals) seront réutilisés.

Le travail de l’étudiant(e) consistera en :

–             Définition d’un protocole d’échange d’informations spatiales et de synchronisation entre simulateurs.

–             Formalisation d’une stratégie de distribution des simulations sur plusieurs machines ou clusters.

–             Application à la création d’un modèle de systèmes agroforestiers Palmier-Riz avec caractérisation de la dynamique de la distribution de la lumière au cours d’un cycle de croissance.

DeepBeesAlert : vers un système de gestion et de protection durable des ressources de pollinisation

Mots-clé: frelon asiatique, espèce invasive, déclin des abeilles, coût de prédation, agriculture numérique, deep learning, suivi d’insecte

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/02/2021
  • Unité de recherche: Amap, Cirad
  • Contact: Borianne Philippe : borianne@cirad.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données, Axe 4 : Système d’information, stockage et transfert de données,Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 5 :  Les services de conseil agricole,Challenge 6 :  La gestion des territoires agricoles

L’abeille domestique, Apis mellifera, maillon essentiel de la biodiversité et pollinisateur principal de nombreuses cultures vivrières en Europe, vit un déclin sans précédent. Pesticides, parasites et changement climatique participent à ce déclin ainsi que le frelon asiatique dont elle est la proie principale. Accidentellement introduit en France en 2004, ce frelon envahit progressivement l’Europe, menaçant à terme l’agriculture et notre sécurité alimentaire. Alors que les recherches engagées pour contrôler ce prédateur sont multiples et peu écologiques, le comportement du frelon devant les ruches n’a jamais été étudié en détail et son impact sur les populations d’abeilles n’a jamais été précisément quantifié. Or seul le traitement automatique de données comportementales acquises en masse à l’échelle du pays permettra d’évaluer le coût économique de ce prédateur, de connaître les types de ruchers les plus impactés et d’alerter sur les moments ou conditions propices d’intervention ou de piégeage.

Ce projet vise à mettre au point une méthodologie fiable et automatisable comptabilisant les évènements de prédation à l’entrée des ruches afin de quantifier l’impact du frelon sur les ruchers et analyser son évolution au cours du temps et les facteurs susceptibles de l’influencer. Il s’agira d’étudier le comportement des frelons et dénombrer à partir de données de vidéosurveillance sur les ruches le ratio captures/attaques dont sont victimes les abeilles au cours du temps afin de mettre en évidence d’éventuelles corrélations entre le taux de prédation et les saisons, les heures de la journée et les conditions météorologiques. De 2016 à 2020, des ruches couplées à des stations météo ont été équipées de caméras de différentes résolutions filmant en continu une journée par semaine entre juillet et novembre (environ 450 heures d’acquisition).

Le stage consiste à mettre en place et valider des solutions de traitement automatique couplant Réseaux de Neurones Profonds de détection et suivi d’objets dans des vidéos à fréquence d’acquisition variable (de 25 à 240 ips) sur des données à déplacement rapide et erratique.

L’étudiant devra réaliser des recherches bibliographiques intégrant les avancées significatives récentes dans le traitement des vidéos (trafics routiers, vol d’oiseaux, etc.), déployer et évaluer un réseau de neurones convolutif adapté à la détection spécifique des frelons et des captures ; des scripts de «suivi» d’objets viendront compléter la solution pour dénombrer correctement les objets d’intérêt dans chaque vidéo; enfin, une analyse des trajectoires de suivi de chaque objet sera engagée pour aborder l’étude comportementale (visites, attaques et captures) des frelons. L’étudiant devra évaluer les résultats produits par la solution retenue et analyser les erreurs de dénombrement mesurées pour améliorer le système proposé et permettre ainsi d’engager des études statistiques à large échelle visant à établir les corrélations entre taux de prédation et facteurs environnementaux.

Simulation participative de la gestion des ressources renouvelables dans des environnements hybrides

Mots-clé: Simulation participative, Computer Vision , Smalltalk, Cormas

  • Durée souhaitée du stage (nombre de mois): 8
  • Date de début du stage: 1/02/2021
  • Unité de recherche: Green, Cirad
  • Contact: Bommel Pierre : bommel@cirad.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 6 : Modélisation et simulation (systèmes de production agricole) / Challenge 1 :  Le challenge agroécologique, Challenge 2 :  Le phénotypage rapide, Challenge 6 :  La gestion des territoires agricoles, Challenge 7 :  Intégration de l’agriculture dans les chaînes de valeur, Challenge 8 :  Développement agricole au Sud

L’ambition d’éliminer les interfaces physiques qui permettent l’interaction avec les machines est une idée ancienne dans le monde de l’informatique qui a pris plusieurs directions. La plus emblématique pour le grand public a émergé en 2005 sous le nom de “projet Natal” repris et démocratisé par Microsoft dans sa dernière version baptisée “Azure Kinect” (2019). Ce capteur détecte les mouvements et les objets dans le champ de vision de l’utilisateur pour produire des résultats dans un logiciel. Il a été abondamment détourné et enrichi depuis ses débuts grand public pour permettre de nouvelles manières d’interagir avec les machines.

Par ailleurs, le groupe de chercheurs à l’origine de la création d’une plateforme de modélisation à base d’agents baptisée Cormas [1] fait actuellement face à des besoins accrus d’interactivités dans les simulations participatives. Basée sur le langage Smalltalk, Cormas est développée depuis la fin des années 1990 par une équipe fortement interdisciplinaire. Au-delà des usages traditionnels de la modélisation agents, Cormas se démarque des autres plateformes par des processus originaux de modélisation : l’approche ComMod (pour Companion Modeling : modélisation d’accompagnement [2]), qui vise à proposer des outils permettant de participer activement à la conception d’un modèle, mais aussi de s’immerger dans des situations de jeux interactifs. Le jeu (de plateau ou informatisé) sert alors de support pour échanger sur une situation vécue.

En 2012, pour la première fois, l’équipe utilisait un video-projecteur à ultra-courte focale pour projeter sur une table un plateau de jeu. Ce simple changement a induit des comportements radicalement différents leur permettant une interaction beaucoup plus naturelle avec les simulations informatisées. En outre, la configuration spatiale des acteurs favorise les interactions sociales. Mais jusqu’à aujourd’hui, la saisie manuelle par l’animateur des décisions prises par les joueurs reste nécessaire ce qui réduit la fluidité et la spontanéité des interactions.

L’équipe en charge du développement de Cormas souhaite investiguer les possibilités offertes par les nouvelles applications liées à la détection d’objets et de mouvements en portant un prototype de simulation participative dans le champ de la simulation hybride entre modèle informatique et jeu physique. Ce travail de preuve de concept appliqué au modèle ReHab (modèle école de ComMod) nécessitera de mettre au point des méthodes de détection fiables d’objets physiques pour être intégrées dans le calcul du nouvel état simulé.

Aujourd’hui, Cormas s’appuie sur Pharo (Smalltalk open-source). Cette solution est développée par l’INRIA et par un consortium de chercheurs et d’industriels. La communauté dynamique propose un ensemble de packages permettant de mutualiser le développement de fonctionnalités qui pourraient être mobilisées pour proposer un prototype pour des simulation participative et la détection d’objets

Deep Learning pour la détection, délimitation et discrimination d’arbres et de vergers de manguiers à partir d’images à THRS

Mots-clé: Télédétection, vergers, très haute résolution spatiale, séries temporelles, deep learning, réseaux de neurones

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Tetis, Cirad
  • Contact: Camille Lelong : lelong@cirad.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données, Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 1 :  Le challenge agroécologique, Challenge 5 :  Les services de conseil agricole, Challenge 6 :  La gestion des territoires agricoles, Challenge 8 :  Développement agricole au Sud

En Afrique de l’Ouest, l’acquisition d’informations sur les filières fruitières est freinée par un manque de méthodes et d’outils adaptés pour caractériser les systèmes à base d’arbres fruitiers souvent complexes (ex. systèmes agroforestiers). Dans ce contexte, le projet PixFruit (UPR HortSys) vise à acquérir des données sur la production de mangues aux échelles de l’arbre et du verger pour informer des modèles de production régionaux afin de fournir des statistiques analytiques précises et fiables aux acteurs de la filière. Afin d’extrapoler les productions de mangues à l’échelle d’une région à partir des données relevées sur le terrain par les outils de PixFruit (smartapp PixFruit), il est nécessaire de délimiter et de classifier les arbres et les vergers pour fournir des données d’entrées complémentaires (surface cultivée, densité de plantation, composition variétale, etc.) aux modèles régionaux.

Nous proposons d’explorer et d’évaluer le potentiel des méthodes de classification et de segmentation neuronales par apprentissage profond pour la production de ces informations à partir des données d’imagerie satellitaire multispectrale à très haute résolution spatiale (Pléiades).

Le premier objectif est de développer, sur la base de cette méthodologie innovante, des outils permettant de détecter, identifier et délimiter les vergers dans un bassin de production, puis d’en discriminer ceux contenant des manguiers. Le second objectif est d’identifier et détourer les manguiers eux-mêmes, en tant qu’arbres individuels, qu’ils soient isolés ou en verger. Il s’agira donc d’obtenir de meilleurs résultats en segmentation (délimitation des vergers, détourage des arbres individuels) et en classification (reconnaissance des vergers selon leur espèce majoritaire, classification typologique des vergers selon la structure et la composition variétale, identification de l’espèce fruitière arbre par arbre) qu’avec les outils classiquement utilisés en télédétection (SVM, RF). Dans ce travail, nous évaluerons le potentiel des deux types de réseaux de neurones les plus utilisés, sur plusieurs architectures de données, pour délimiter et classifier les vergers : les réseaux convolutifs (CNN) sur deux images Pléiades acquises en mars et juillet 2017, puis des réseaux récurrents (RNN) sur l’association de ces images Pléiades et d’une série temporelle Sentinel-2. Enfin, nous analyserons les performances du réseau Mask-RCNN (Regional Convolutional Neural Network) pour identifier et segmenter correctement les arbres.

La zone des Niayes au Sénégal (503 km2) fera office de zone d’étude, pertinente par sa diversité de systèmes de culture comprenant différents niveaux de complexité et de densité (monocultures fruitières, systèmes extensifs et systèmes agroforestiers) et la présence de nombreuses espèces d’arbres cultivés (ex. manguiers, agrumes, anacardiers, neems…). En outre, cette zone bénéficie d’une importante base de données de terrain (11300 manguiers et 12211 vergers, issus de la thèse #DigitAg de Julien Sarron) et d’une expertise agronomique obtenues dans le cadre du projet PixFruit, qui permettront la réalisation technique de cette étude.

Collecte et analyse de données issues des ruches connectées des apiculteurs

Mots-clé: séries temporelles, balances connectées, production de miel,  apiculture, gestion de base de données

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 15/01/2021
  • Unité de recherche: Itsap, Acta
  • Contact: Fabrice ALLIER : allier@itsap.asso.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 6 : Modélisation et simulation (systèmes de production agricole) / Challenge 1 :  Le challenge agroécologique, Challenge 4 :  Des productions animales durables, Challenge 5 :  Les services de conseil agricole

L’apiculture fait face à de nombreux enjeux depuis quelques décennies dont les causes et les conséquences plongent les apiculteurs et l’économie de la filière dans une situation toujours incertaine. En réponse au déclin des abeilles, à la baisse de la production de miel français et aux fortes contraintes environnementales, les apiculteurs expriment de plus en plus le besoin d’être accompagnés techniquement et d’appuyer leurs stratégies sur des références et des outils d’aides à la décision.

Une proposition est d’étudier le comportement des colonies d’abeilles domestiques, leur dynamique sur une période et dans un territoire donné et leur performance en termes de production de miel. Pour cela, les apiculteurs utilisent depuis une quinzaine d’années des balances électroniques et connectées mesurant en temps réel le poids des ruches. Avec des quelques milliers de balances désormais en fonctionnement chez les apiculteurs et des remontés d’information horaire, cela constitue une masse de données encore sous valorisée à ce jour. En outre, la capacité d’une colonie à exploiter les ressources en nectar est influencée par des facteurs biotiques (état de développement des colonies, ressources florales) et abiotiques (météorologie) qui pourront être considérés en fonction de la disponibilité de ces données. En croisant ces différentes sources de données et en mettant en œuvre les méthodes de la science des données, cela offre un beau potentiel pour construire les services de prédiction de demain.

Une thèse pilotée par l’ITSAP en collaboration avec l’INRIA sur cette thématique avait été acceptée par DigitAg en 2018, mais sa mise en œuvre fût contrecarrée par la survenue d’une crise financière de l’ITSAP. La stabilité financière de l’Institut étant aujourd’hui sécurisée, et le sujet étant toujours aussi important pour la filière apicole, nous souhaitons relancer cette dynamique scientifique en 2021 par ce sujet de stage. Une nouvelle soumission d’un sujet de thèse en continuité de ce stage sera également réalisé.

De plus, ce stage s’appuiera sur la dynamique de l’open lab Apiculture d’Occitanum qui prévoit également des actions sur ces technologies de balance connectées pour développer des outils d’aide à la décision pour les apiculteurs.

Les travaux du stagiaire viseront à

–             Démarcher des apiculteurs afin de recueillir leur consentement pour collecter les données numériques des balances (une centaine minimum) et compléter les données contextuelles indispensables à l’interprétation de l’évolution des courbes de poids générées par les balances (i.e. géolocalisation, changement et date de lieux lors des transhumances des ruches, activité/miellée visée par l’apiculteur). Cette tâche sera réalisée en direct par le stagiaire ou il viendra en appui à des conseillers d’associations de développement apicole en charge d’assurer cette collecte de données.

–             Valider la qualité des données collectées selon le cahier des charges du format requis pour la BDD « Système Informatique MIELLEES », déjà opérationnelle et développée par INRAE Genphyse et ITSAP-Institut de l’abeille en 2019-2020.

–             Appliquer une routine de « nettoyage » des données numériques de l’évolution du poids à partir d’une programmation R acquise et testée sur un jeu de données expérimentales restreint en 2020 (identification du type de données, validation du pas de temps, gestion des données manquantes, validation de la variation du poids, correction des poids, éventuellement segmentation).

–             Identifier des sous-ensembles de données cohérentes à partir de critères apidologiques (bassin de production de miel, période, miellée visée, densité de balances identifiées par unité de surface…).

–             Développer et éprouver la dynamique temporelle du poids d’une ruche (variable d’intérêt) pour prédire la capacité de la colonie à exploiter les ressources en nectar disponibles dans un rayon de butinage donné et en lien avec les facteurs climatiques. Différentes méthodes d’apprentissage machine seront testées.

–             Proposer des sorties opérationnelles, simples et pédagogiques pour les apiculteurs des résultats obtenus à partir des sous-ensembles de données cohérentes : visualisation et cartographie des productions, moyenne de l’évolution des poids, positionnement de l’activité d’une colonie par rapport à d’autres colonies, identification des jours favorables au butinage selon la météorologie…

Analyse de modes de représentation simplifiée de l’architecture pour améliorer les simulations des modèles de culture 

Mots-clé: architecture aérienne, analyse d’images, modèles 3D, modèles de culture, photosynthèse, transpiration

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Lepse, Inrae
  • Contact: Pallas Benoît : pallas@inrae.fr
  • #DigitAg: Axe 6 : Modélisation et simulation (systèmes de production agricole) / Challenge 2 :  Le phénotypage rapide

La maitrise de l’architecture aérienne est un enjeu majeur pour optimiser le fonctionnement des couverts végétaux car l’architecture affecte directement la quantité de rayonnement interceptée et le microclimat à l’intérieur de la canopée, modulant ainsi de nombreuses fonctions physiologiques (photosynthèse, transpiration, efficience d’utilisation de l’eau). Cet enjeu d’optimisation de la structure du couvert est très fort sur la vigne car de nombreuses pratiques visent à la modifier (éclaircissage, écimage, palissage…). Des approches de modélisation dites structure-fonction (FSPM) ont été développées pour simuler sur des architectures 3D de nombreux processus écophysiologiques. Cependant elles apparaissent souvent difficiles à utiliser, du fait de la charge expérimentale nécessaire pour acquérir des architectures 3D détaillées. Parallèlement, de nouvelles méthodes de phénotypage rapide (lidar, imagerie aéroporté, photogrammétrie) sont en développement et permettent d’acquérir rapidement des informations sur les caractéristiques architecturales des couverts. Par ailleurs, des modèles de culture ayant pour objectif de simuler le rendement dans différents contextes pédoclimatiques existent, mais ils n’intègrent que peu la dimension architecturale et la variabilité intra-plante du fonctionnement. L’objectif de ce stage est donc de déterminer, chez la vigne, des modes de représentations simplifiées de l’architecture aérienne qui pourraient être pertinents à coupler avec des modèles de culture afin de mieux simuler des variables potentiellement affectées par l’architecture et présentant une forte hétérogénéité spatiale (interception du rayonnement, photosynthèse, transpiration). L’objectif finalisé est ainsi de proposer et éventuellement de tester de nouveaux protocoles permettant d’acquérir ces données architecturales rapidement au champ. Les activités de recherche seront menées au sein de l’UMR LEPSE à Montpellier en se basant sur des modèles existants et déjà éprouvés (TopVine, Louarn et al. 2008 ; RATP, Sinoquet et al. 2001; Hydroshoot, Albasha et al. 2019) et disponibles sur la plateforme de modélisation OpenAlea (Pradal et al. 2008). Il s’agira ici de générer in silico à partir de données 3D acquises par digitalisation magnétique des représentations simplifiées de l’architecture compatibles avec du phénotypage au champ (lidar, imagerie). En se basant sur ces représentations, des simulations de processus écophysiologiques (photosynthèse, transpiration) seront alors réalisées en testant différents niveaux et méthodes d’agrégation du feuillage (plante entière, voxels…). Les résultats seront alors comparés aux simulations obtenues sur les structures 3D détaillées (considérées comme référence) afin de déterminer le meilleur compromis entre (1) erreur globale à l’échelle de la plante, (2) capacité de la méthode à rendre compte de la variabilité spatiale, (3) facilité de l’acquisition des données d’entrée et (4) temps de calcul. Ce mode de représentation de l’architecture et la méthodologie de calcul associée pourront alors être proposés comme entrées des modèles de culture afin de tester rapidement l’impact de différents modes de conduite sur des variables intégratives du fonctionnement.

Conception et réalisation d’un service Web de recommandation de ressources sémantiques pertinentes en agriculture

Mots-clé: Apprentissage automatique, données liées et ouvertes (LOD), Web sémantique, Web service, et agriculture.

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/02/2021
  • Unité de recherche: Lirmm, Université de Montpellier
  • Contact: Emna Amdouni : amdouni@lirmm.fr
  • #DigitAg: Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 8 :  Développement agricole au Sud

Le stage de master est proposé dans le cadre du projet D2KAB (www.d2kab.org), démarré en 2019, il vise à aider les développeurs et utilisateurs des données de l’agriculture à transformer leurs données en connaissances exploitables. Le projet D2KAB développe et maintient le portail AgroPortal qui est une plateforme publique des ressources sémantiques (thésaurus, terminologies, vocabulaires, et ontologies), elle est spécialisée dans le domaine de l’agriculture et de l’agronomie. AgroPortal est fondé et maintenu par le LIRMM en collaboration avec l’INRAE, il héberge environ 126 ressources sémantiques et propose à ses utilisateurs une variété de services Web sémantique (recherche, annotation, alignement, etc.).

Actuellement, nous mettons en place un nouveau service Web qui permet de rendre les ressources sémantiques d’AgroPortal facilement interopérables et réutilisables. Plus concrètement, nous adoptons des principes de la science ouverte, entre autre les principes FAIR (acronym de Findable, Accessible, Interoperable, and Reusable) que nous appliquons aux ressources sémantiques, à travers l’exploitation des techniques automatiques. C’est dans ce cadre que nous proposons un stage qui vise à construire et mettre en place un système de recommandation des ressources sémantiques (décrites en OWL, OBO et SKOS) au sein de notre plateforme. Nous souhaitons que le système de recommandation qui sera mis en place par le futur stagiaire vient supporter et valoriser, à une échelle internationale, la vision FAIR d’AgroPortal.

L’objectif principal du stage est d’utiliser des techniques d’intelligence artificielle pour la réalisation d’un outil de recommandation de ressources sémantiques. Plus précisément, les missions principales du stage concernent :

  1. Mise en œuvre d’une méthode d’identification des ressources sémantiques similaires en se basant sur leur description (par exemple, auteurs, métriques, etc.) et contenu (par exemple, concepts clés, alignements, etc.).
  2. Recommandation d’éventuelles ressources sémantiques pertinentes en utilisant des techniques de machine Learning exploitant des métadonnées visant à améliorer l’intégration et la réutilisation des référentiels existants d’AgroPortal.
  3. Développement d’une interface de visualisation des recommandations.
  4. Déploiement du service Web sur notre portail et expérimentation des résultats.

La réalisation des missions du stage nécessitera une motivation pour apprendre les technologies du Web sémantique, une bonne connaissance des techniques d’intelligence artificielle existantes, et la maîtrise d’au moins un langage de script tel que R ou Python.

Profil du candidat souhaité :

–             Formation en informatique, science de données ou équivalent

–             Solide compétences en développement Web et dans les langages C ou Java

–             Motivé, autonome et rigoureux

Caractériser les milieux naturels paturés  par télédétection pour évaluer la durabilité de l’élevage pastoral de la region PACA

Mots-clé: Milieux pastoraux, Occupation des sols, Télédétection

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/04/2021
  • Unité de recherche: Selmet, Inrae
  • Contact: Shaqura Imad : shaqura@inrae.fr
  • #DigitAg: Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données / Challenge 1 :  Le challenge agroécologique, Challenge 4 :  Des productions animales durables, Challenge 6 :  La gestion des territoires agricoles

Les interactions entre l’élevage pastoral et les « milieux naturels » sont une composante importante de la résilience des systèmes socio-écologiques de l’espace de l’arrière-pays de la région Provence-Alpes-Côte-D’azur. C’est espaces y occupent plus de 30 % des surfaces   et l’activité d’élevage contribue au dynamiques écologiques et sociales. Cette activité est fortement imbriquée dans le multi usage des espaces à d’autres activités qui conjointement définissent l’identité des territoires. Mais l’inscription spatiale du pâturage ainsi que ses relations aux dynamiques d’occupation des sols, contrairement à d’autres pratiques agricoles (labour, fauche), est difficilement renseignée avec précision.

Les croisements entre occupation des sols et leur usage par le pâturage est toutefois au centre des préoccupations tant en ce qui concerne la capacité d’adaptation et d’atténuation au changement climatique, la maitrise des dynamiques écologiques en regard de la préservation de la biodiversité des milieux et de la prévention des incendies de forêt. La durabilité de l’activité d’élevage,  elle-même,  est directement mise en question par la  « fermeture » des milieux pastoraux  que les pratiques de pâturage peinent à endiguer. Le renouvellement à moyen terme de  la ressource fourragère pour les troupeaux au pâturage est menacé ainsi que le maintien de ces espaces dans les critères d’admissibilité ouvrant droit aux soutiens du premier pilier de la PAC. La caractérisation de l’occupation du sol de ces milieux  et leurs dynamiques écologiques sont ainsi au cœur de l’analyse de la durabilité de l’activité d’élevage pastoral de la région.

Les cartes d’occupation des sols disponibles (tel corine land cover, …) ne permettent pas  d’opérer de manière satisfaisante ces croisements. Aussi avons-nous entrepris un travail portant :

–             D’une part sur la caractérisation fine des usages des espaces pastoraux reposant sur les données de l’enquête pastorale réalisée par les acteurs de l’élevage à l’échelle du massif des alpes et sur les déclarations des agriculteurs au registre parcellaire graphique de la PAC.

–             D’autre part sur la caractérisation des occupations des sols de ces espaces en ayant recours à une classification supervisée (Bayes) de 5 classes de fermeture des milieux à partir d’image SPOT 6 et de segmentation multi résolutions (Baatzshape).

Le stage proposé vise à adapter cette méthodologie de caractérisation de l’occupation du sol à l’ensemble de la région. Ce travail permettra de produire une carte facilement actualisable permettant l’identification d’espaces particulièrement exposés et l’aide à la décision des acteurs de l’élevage dans le cadre d’actions publiques visant à conforter le futur de l’activité.

Mise au point d’un capteur optique pour le suivi du contenu biochimique foliaire: aide au suivi de l’état physiologique

Mots-clé: Chimie foliaire; Suivi de la végétation; Spectroscopie foliaire; Capteurs optiques; Modélisation physique

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/03/2021
  • Unité de recherche: Tetis, Inrae
  • Contact: Jean-Baptiste Féret : feret@teledetection.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données / Challenge 3 :  La protection des  cultures, Challenge 7 :  Intégration de l’agriculture dans les chaînes de valeur

Les pratiques agricoles doivent s’adapter aux changements climatiques, qui influencent les pratiques agricoles par leur impact sur les températures et les précipitations. La composition chimique foliaire est un indicateur pertinent pour suivre l’état physiologique d’une plante, sa phénologie, et le développement de maladies dans ce contexte d’évolution rapide des conditions environnementales.

Les avancées récentes dans le domaine de la modélisation physique des feuilles  et dans l’instrumentation optique permettent aujourd’hui d’envisager de mesurer la chimie foliaire à l’aide d’outils portables bas cout. Le modèle PROSPECT permet ainsi d’estimer les principaux constituants chimiques foliaires (chlorophylle, caroténoïdes, anthocyanes, eau et matière sèche). Le suivi de cette signature biochimique permet alors de diagnostiquer l’état des cultures, détecter le stress et la présence éventuelle de certains pathogènes à un stade précoce. La cartographie de la chlorophylle foliaire par la télédétection est ainsi utilisée de manière opérationnelle depuis de nombreuses années afin d’aider à la décision dans l’itinéraire technique de l’agriculteur et dans la prévision des récoltes.

Les résultats de recherche en cours montrent qu’il est possible de parvenir à une quantification fine de la chimie foliaire à l’aide des outils de modélisation et par l’acquisition parcimonieuse de propriétés optiques foliaires dans le domaine optique, permettant d’envisager de développer un capteur portable type leaf-clip basé sur un éclairage multispectral à base de diodes laser et d’une détection synchrone multi-porteuse (technologie brevetée par INRAE ).

L’objectif de ce stage est de définir un cahier des charges par la mise en place de simulations permettant d’identifier l’informations spectrale pertinente, et d’élaborer un prototype pour quantifier la chimie foliaire. Dans un premier temps, l’étudiant devra comprendre les différents phénomènes optiques mis en jeu et s’approprier les outils de modélisation existant . Il déterminera ensuite la combinaison de longueurs d’onde permettant une estimation optimale de la chimie foliaire, en combinant bases de données simulées et expérimentales disponibles. Enfin, à partir des résultats obtenus, il développera un prototype de laboratoire. Ce système sera caractérisé et validé avec des données expérimentales issues de différents types de culture. Ce travail permettra de valoriser les résultats de recherche des UMRs TETIS et ITAP et pourra déboucher sur le dépôt d’un brevet.

Visualisation et Navigation dans des données spatio-temporelles agro-environnementales classées par l’analyse de concepts 

Mots-clé: Data mining, Relational Concept Analysis, Agroecology, crop protection, knowledge base

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 15/02/2021
  • Unité de recherche: Lirmm, Université de Montpellier
  • Contact: Marianne Huchard : huchard@lirmm.fr
  • #DigitAg: Axe 1 : Impact des technologies de l’information et de la communication sur le monde rural, Axe 5 : Fouille de données, analyse de données, extraction de connaissances / Challenge 1 :  Le challenge agroécologique, Challenge 3 :  La protection des  cultures, Challenge 8 :  Développement agricole au Sud

Avec l’essor du numérique, la recherche agronomique a produit de nombreux jeux de données sur l’agriculture et l’environnement qu’il s’agit de mobiliser pour développer des outils d’aide à la décision à destination des populations du Nord et du Sud. Parmi ces jeux de données, on peut citer par exemple celui sur les cours d’eau de deux bassins versants français du projet Fresqueau (http://dataqual.engees.unistra.fr/fresqueau_presentation_gb) avec des données spatio-temporelles ou celui sur l’usage des plantes à effet pesticide et antibiotique du projet Knomana (https://agris.fao.org/agris-search/search.do?recordID=FR2019109314) pour la santé animale, végétale, humaine et publique dont le modèle de données comporte une structure ternaire.

Pour développer l’outil d’aide à la décision, la méthode de classification utilisée par ces projets pour modéliser la temporalité et la relation ternaire est l’Analyse de Concepts Relationnels (RCA). Par l’emploi de quantificateurs logiques, RCA groupe et classe des groupes d’entités partageant des propriétés et des relations communes, soutenant par exemple le raisonnement par exploration de propriétés et de similarités, le raisonnement par abduction pour la création d’hypothèses, et la recherche de solutions alternatives par voisinage avec des solutions connues. Pour éviter de calculer l’ensemble de la classification pour naviguer et explorer le jeu de données de proche en proche, une méthode de calcul à la volée a été développée (On-demand). Le problème auquel sont confrontées les équipes porteuses de ces projets, i.e. le LIRMM, l’UPR AIDA, l’UMR IPME et l’ENGEES, est de disposer d’un outil de visualisation et de navigation dans ces données classées par RCA.

Par ailleurs, le LIRMM conduit des recherches en visualisation analytique (Keim et al. 2008). Ce domaine porte sur l’étude des interfaces visuelles interactives permettant d’explorer des jeux de données complexes et hétérogènes afin de faciliter le raisonnement analytique sur les données et ainsi d’en tirer des connaissances (voir par exemple (Accorsi et al. 2014) développé dans le cadre du projet Fresqueau).

Dans le cadre de ce stage, l’objectif est de développer un prototype logiciel de visualisation de jeux de données, comportant des données spatiales et ou temporelles, classés par RCA. Plus précisément, le stagiaire réalisera une visualisation interactive permettant de piloter les calculs à la demande de RCA et d’en afficher, de façon incrémentale, les résultats. Plusieurs approches visuelles seront combinées afin de donner à l’utilisateur une vue d’ensemble de l’espace de connaissances extrait et, à la demande, une vue détaillée de sous-ensembles de la classification calculés à la volée. Différentes méthodes d’interaction (Munzner 2014, chapitres 11-14) et différentes techniques de visualisation de graphes (Tamassia 2013) seront utilisées. Le stagiaire suivra les étapes de conception décrites par Sedlmair et al. 2012 : étude de la littérature, définition du besoin en termes de problème visuel, proposition d’une maquette, développement, déploiement, validation.

Caractériser l’architecture et la production d’une collection de pommiers à partir de scans Lidar

Mots-clé: LiDAR aéroporté, deep learning, traitement de points, core-collection de pommiers, phénotypage haut-débit

  • Durée souhaitée du stage (nombre de mois): 6
  • Date de début du stage: 1/02/2021
  • Unité de recherche: AGAP, Inrae
  • Contact: Costes Evelyne : costes@inrae.fr
  • #DigitAg: Axe 3 : Capteurs, acquisition et gestion de données / Challenge 2 :  Le phénotypage rapide

Dans un contexte de changement climatique et de diminution des intrants (engrais, eau, pesticides, etc.), la sélection de variété d’arbres fruitiers performants en condition de culture sub-optimale devient incontournable. Des traits architecturaux (structure de la plante, distribution du feuillage) doivent être considérés pour prendre en compte le potentiel de production intrinsèque des variétés (génotypes), leurs interactions avec l’environnement (lumière, pluie, insectes, etc.) et leur facilité de conduite. Pour évaluer de tels traits de manière précise et à haut débit, nous développons une approche basée sur les LiDARs aéroportés qui permettent de scanner rapidement un verger en 3D. Ce choix fait suite à des premières expérimentations qui ont consisté à scanner en période de production (avec feuilles et fruits) les arbres d’une collection de variétés de pommiers, par LiDAR terrestres. Ces approches se sont révélées fastidieuses dans le processus d’acquisition. Elles nous ont toutefois permis une première caractérisation de l’architecture des arbres (Coupel et al., 2019) et une estimation de leur production (Artzet et al., 2020). Une partie de ces méthodes est basée sur des approches de machine et deep learning, avec notamment l’utilisation de réseaux pour le traitement de points, tel que RandLa-Net (Hu et al., 2019). Récemment, nous avons souhaité revisiter la méthode d’acquisition en procédant à des scans par Lidar aéroporté, plus rapides. Néanmoins les résolutions et les points de vue différents entre LiDAR terrestre et aéroporté nécessitent d’adapter les méthodes. De plus, dans le contexte de scans de vergers entiers, l’identification des arbres individuels et des points leur correspondants est un challenge important pour l’automatisation de nos méthodes.

L’objectif de ce stage est donc de formaliser un pipeline de traitement de points qui permettra d’identifier automatiquement chaque instance d’arbre, de caractériser sa forme, sa densité foliaire et sa production en adaptant des indicateurs et les méthodes d’estimation associé à ces nouvelles données. Pour cela, il sera nécessaire de revisiter les différentes étapes des pipelines mis en place précédemment, notamment la création d’une base de données d’apprentissage pour lequel des données issues de la simulation pourront être utilisées (modèle MappleT de génération de modèles architecturés 3D virtuels de pommiers (Costes et al., 2008)). Des méthodes de scans virtuels simulant l’acquisition par drone devront être mis en place ainsi que des méthodes de transfer learning pour reproduire le bruit observé dans les données réelles. Pour l’estimation de la production, des points correspondants aux pommes pourront être identifiés avec des méthodes tels que RandLa-Net. Néanmoins, le clustering résultant pour identifier les instances de pommes devra être robuste à des faibles échantillonnages par points.

Les attendus de ce pipeline sont des indicateurs objectifs du développement et de la production des arbres pouvant entrer dans des analyses génétiques de type GWAS.