[Thèse soutenue] Rodrique Kafando: Intégration et analyse de données hétérogènes massives pour une observation intelligente du territoire

Sujet de thèse labellisé par #DigitAg

Rodrique a soutenu sa thèse le vendredi 3 décembre à 14h à l’Inrae (salle Saltus, 500 rue Jean François Breton).

 

Je suis Rodrique Kafando, doctorant en 3ème année en Informatique à l’école doctorale Information Structure Systèmes (I2S) – Université de Montpellier. Je réalise ma thèse  à l’UMR TETIS, sur l‘Intégration et l’analyse de données hétérogènes massives pour une observation intelligente du territoire.

Après l’obtention de mon Master Informatique, option Systèmes Intelligents et Multimédias, j’ai souhaité poursuivre mes études de 3ème cycle dans le domaine de la science de données.

Ce qui me motive le plus dans mes études doctorales, c’est de partager mes connaissances et de faire partie d’une communauté scientifique dynamique répondant à de vrais besoins sociétaux.

 

Intégration et analyse de données hétérogènes massives pour une observation intelligente du territoire

  • Date de démarrage : 01/02/2019
  • Université : Université de Montpellier, France
  • Ecole doctorale : Information Structures Systèmes (I2S)
  • Discipline / Spécialité : Informatique
  • Directeur de thèse : Maguelonne Teisseire, Tetis, Inrae
  • Encadrant(es)  : Lucile Sautot, Tetis, AgroParisTech, Rémy Decoupes, Tetis
  • Financement : Métropole de Montpellier, AgroParisTech, INRAE
  • #DigitAg :  Thèse labellisée –  Axe 6 : Modélisation et simulation (systèmes de production agricole) – Challenge 0: sujet transversal

Mots-clés : fouille de données, données hétérogènes, observation

Résumé : L’avènement des nouvelles technologies de la communication et de l’information (NTIC) accélère la croissance des données produites par les services qu’offrent les grandes villes à leur population dans divers domaines. Parmi ces données, nous pouvons citer : les données textuelles (disponibles sur le Web), les images satellites, les données issues de capteurs, etc. Ces données sont essentiellement issues des services proposés pour répondre aux besoins quotidiens des habitants comme la mobilité, la communication, la santé, ainsi que les services de gestion des différentes ressources comme l’eau, les exploitations agricoles et urbaines, l’énergie, etc. Cette forte croissance remet en question la complétude et l’efficacité des méthodes et techniques classiquement utilisées en fouille de données. Les difficultés rencontrées sont principalement liées à la volumétrie des données, mais aussi à leur complexité telle que la forte hétérogénéité. Notre sujet de recherche s’inscrit dans le cadre de la démarche ÉcoCité de la Métropole de Montpellier Méditerranée (3M), et vise à développer une démarche d’observation intelligente du territoire à partir des masses de données dont-elle dispose. Dans cette thèse, nous nous intéressons à l’enrichissement mutuelle entre des données fortement hétérogènes pour le suivi des territoires. Nous limitons notre étude à trois thématiques qui sont, l’urbanisation, l’agriculture et l’hydrologie sur le territoire de la métropole de Montpellier. Pour ce faire, nous déclinons dans cette étude, une chaîne de traitement qui regroupe des approches permettant : 1) de collecter des séries temporelles de données textuelles pour la constitution de corpus thématiques avec un ancrage sur le plan spatial et de les analyser, 2) de stocker ces données massives et hétérogènes afin de les rendre accessibles et analysables par tous, sans pour autant les détériorer, 3) d’extraire des indicateurs permettant de mettre en relation les données des différentes thématiques, tant sur le plan spatial, temporel que thématique, et 4) d’extraire des connaissances à partir de ces données, afin de montrer l’impact de ces thématiques sur l’évolution du territoire de façon globale. À partir de ces différentes approches, nous mettons en évidence l’importance de la mise en relation de données gérées jusqu’ici en silo, en faisant ressortir des connaissances pouvant servir de système d’aide à la décision. L’ensemble des approches méthodologiques que nous proposons dans cette étude, constitue une chaîne de traitement complète, allant de la collecte des données hétérogènes à leur mise en relation et analyse pour l’extraction des connaissances pour la description d’événements territoriaux sur le plan spatio-temporel.

Membres du jury

Rapporteurs :

– Jérôme Darmont, PR / Université de Lyon 2 – ERIC

– Franck Ravat, PR / Université de Toulouse I, IRIT

Examinatrices :

– Carmen Gervet, PR, Université de Montpellier, Espace-Dev

– Carmen Brando, Docteur, Ingénieur de recherche, EHESS (Ecole des hautes études en sciences sociales), CRH (centre de recherches historiques)

Invitée :

– Hélène Roussel, Métropole de Montpellier

Encadrants :

– Maguelonne Teisseire, Directrice de Recherche, INRAE – UMR TETIS

– Lucile Sautot, Maître de conférences, AgroParisTech – UMR TETIS

– Rémy Decoupes, Ingénieur de recherche, INRAE – UMR TETIS


Contact:  rodrique.kafando [AT] inrae.fr – Tél : 0766121245

Réseaux sociaux  : ResearchGate LinkedIn

Communications/Publications:

Télécharger le mémoire de thèse

  • Rodrique Kafando, Rémy Decoupes, Lucile Sautot and Maguelonne Teisseire. Spatial Data Lake for Smart Cities: From Design toImplementation. Proceedings of the 23nd AGILE (Association ofGeographic Information Laboratories in Europe) conference, Chania,Crete, Greece – 6-19 June, 2020. (Open Access)
  • Rodrique Kafando, Rémy Decoupes, Lucile Sautot and Maguelonne Teisseire. Modélisation de la dynamique des territoires : méta-données et lacs de données dédiés à l’information spatiale. Actes du XXXVIIIème Congrès INFORSID, Dijon, France, June 2-4, 2020. (Open Access)