[Doctorant] Oussama Mecchour

[Doctorant] Oussama Mecchour: Intégration et normalisation de bases de données expérimentales dans le domaine de l’agroécologie

Sujet de thèse cofinancée par #DigitAg

Intégration et normalisation de bases de données expérimentales dans le domaine de l’agroécologie : approches de fouille de textes guidées par des informations sémantiques

OMecchour

J'effectue ma thèse au sein des UMR Aida, Tetis et Mistea sur l'Intégration et la normalisation de bases de données expérimentales dans le domaine de l’agroécologie. Je travaillerai à La Réunion pendant la moitié de ma thèse et à Montpellier sur l'autre. 
Je suis spécialisé dans la science de données, et j'apprécie la solution de problèmes dans la recherche. 
Cette thèse est un prolongement de mon travail de stage réalisé au Cirad. Pendant ces 4 mois, j'ai eu l'opportunité de plonger dans le domaine de l'agroécologie en tant qu'informaticien. J'ai acquis une compréhension approfondie de ce domaine, et je suis convaincu que notre travail apportera une solution significative au problème d’interopérabilité des données en agroécologie.
En ce qui concerne le stage effectué, nous avons obtenu des résultats tout à fait encourageants qui montrent que la combinaison d’approches et l’intégration de méthodes d’IA (modèles de langues) améliorent les résultats.

  • Date de démarrage : 12 octobre 2023
  • Université : Université de Montpellier
  • Ecole doctorale : I2S
  • Discipline / Spécialité : Informatique
  • Directeur de thèse : Krishna Naudin, UPR Aida, Cirad
  • Encadrant(es)  : Sandrine Auzoux, UPR Aida, Cirad - Mathieu Roche, UMR Tetis, Cirad
  • Financement : #DigitAg – InterCropValues (Horizon)
  • #DigitAg : Thèse cofinancée – Axe 5 : Fouille de données, analyse de données, extraction de connaissances, Axe 2 : Innovations en agriculture numérique, Axe 3 : Capteurs, acquisition et gestion de données, Axe 4 : Système d’information, stockage et transfert de données, Axe 6 : Modélisation et simulation (systèmes de production agricole), Challenge 1 : Le challenge agroécologique, Challenge 3 : La protection des cultures
    Challenge 8 : Développement agricole au Sud

Mots-clés : Agroécologie, Science des données, Extraction de Connaissances

Résumé : Un des enjeux pour améliorer les méthodes de modélisation en agroécologie et leur reproductibilité est de mettre en relation et normaliser les variables expertes et les variables modèles en intégrant les informations sémantiques qu’elles véhiculent. Dans ce cadre, les données textuelles associées aux variables (publications scientifique, rapports techniques, blog, etc.) et les ressources sémantiques de type « ontologies » peuvent apporter un éclairage sémantique crucial pour contextualiser les variables. L'objectif de cette thèse consiste à proposer une approche générique pour automatiser la labellisation des variables créés par les experts et leur mise en relation avec les variables des modèles, en mobilisant des méthodes de fouille de texte guidées par des informations sémantiques.

Contact : oussama.mechhour [AT] cirad.fr

Date de modification : 04 avril 2024 | Date de création : 27 novembre 2023 | Rédaction : GL