[Thèse soutenue] Priscilla Keip : Conversion automatique de modèles et de jeux de données pour l’exploration conceptuelle : Application à une base de connaissances du vivant

Sujet de thèse cofinancée par #DigitAg

Priscilla a soutenu sa thèse le jeudi 16 décembre 2021 à 9h00 à l’Université de Montpellier – Campus Saint-Priest, LIRMM, 161, rue Ada, Bâtiment 4, Rez De Chaussée, salle de Séminaires (à l’entrée du bâtiment)

Conversion automatique de modèles et de jeux de données pour l’exploration conceptuelle : Application à une base de connaissances du vivant

  • Date de démarrage : Novembre 2018
  • Université : Université de Montpellier
  • Ecole doctorale : I2S – Information, Structures, Systèmes
  • Discipline / Spécialité : Informatique
  • Directeur de thèse : Marianne Huchard, Université de Montpellier, LIRMM
  • Encadrant(es)  : Marianne Huchard, Université de Montpellier, LIRMM, Pierre Martin et Pierre Silvie, Cirad, Aida
  • Financement : #DigitAg – Cirad
  •  #DigitAg : Thèse cofinancée – Axe 5 – Challenges 1: sujet transverse

Mots-clés : Base de connaissances, Base de données, Exploration conceptuelle, Analyse de Concepts Formels, Conversion, Knomana, Relation n-aire, Indétermination, Ingénierie dirigée par les modèles

Résumé : Les Sciences du vivant et de l’environnement génèrent de nombreuses bases de données et de connaissances. L’exploration conceptuelle est une approche de fouille de données qui permet d’en extraire de nouvelles connaissances. Les méthodes d’exploration conceptuelle considérées dans ce travail relèvent de l’Analyse de Concepts Formels (FCA). Toute méthode issue de FCA imposant en entrée une structuration prédéfinie des données, la question de recherche traitée concerne la conversion automatique d’une base de données ou de connaissances en vue de son exploration avec FCA ou avec l’Analyse de Concepts Relationnels (RCA), une extension aux données multi-relationnelles.Pour asseoir ce travail, nous avons utilisé la base de connaissances Knomana, qui rassemble des descriptions d’usage de plantes. Selon les connaissances considérées, diverses problématiques de conversion doivent être résolues pour permettre une fouille de données pertinente par les utilisateurs finaux. Ces problématiques peuvent se situer au niveau du schéma (modèle de classes) ou au niveau des instances, principalement (1) la conversion des relations de spécialisation en aplatissant la hiérarchie d’héritage; (2) la conversion d’une relation ternaire via la matérialisation ou des relations binaires, et (3) la levée de l’indétermination de la désignation d’organismes vivants par l’usage de l’abréviation spp. dans sa dénomination binominale (linnéenne). La méthodologie adoptée relève de l’ingénierie dirigée par les modèles, de la transformation des bases de données, du refactoring en ingénierie logicielle et de la conversion d’ontologies. Cette thèse présente un algorithme général de conversion d’un jeu de connaissances pour RCA, dont la structure est représentée sous la forme d’un diagramme de classes au format UML. L’algorithme est appliqué à Knomana et diverses modélisations de la relation ternaire en relations binaires et une modélisation de la levée de l’indétermination d’un nom d’espèce sont expérimentées. L’évaluation de cet algorithme est effectuée en regard de son applicabilité, de son aptitude à être utilisé pour des volumes de données importants (i.e. passage à l’échelle), et de sa pertinence. La perspective offerte par ce travail est de permettre l’analyse de tout jeu de données et de connaissances avec FCA et RCA.

Constitution du jury

Mario Lezoche, Maître de Conférences, CRAN, Université de Lorraine, Nancy – Rapporteur
Isabelle Wattiau, Professeur, Dpt SI/Décision/Stat., ESSEC Business School, Paris – Rapportrice
Thierry Bourgoin, Professeur, LIS, Muséum National d’Histoire Naturelle, Paris – Examinateur
Isabelle Mougenot, Maître de Conférences, Espace-Dev, Univ. Montpellier, Montpellier – Examinatrice
Farouk Toumani, Professeur, LIMOS, Univ. Blaise-Pascal, Clermont-Ferrand – Examinateur
Marianne Huchard, Professeur, LIRMM, Univ. Montpellier, Montpellier – Directrice de la thèse
Pierre Martin, Chercheur, AÏDA, CIRAD, Montpellier – Co-encadrant de la thèse
Pierre Silvie, Chercheur, AÏDA et PHIM, IRD, Montpellier – Co-encadrant de la thèse


Contact:  priscilla.keip [AT] cirad.fr​

Communications /Publications

Télécharger le mémoire de thèse

Publications dans des journaux internationaux à comités de lecture

  • Braud A., Dolques X., Gutierrez A., Huchard M., Keip P., Le Ber F., Martin P., Nica C. and Silvie P (2020),Dealing with Large Volumes of Complex Relational Data using RCA, Complex Data Analytics with Formal Concept Analysis, 

Publications dans des conférences internationales

  • Silvie P.J., Martin P., Huchard M., Keip P., Gutierrez A., Sarter S. (2021) Prototyping a knowledge-based system to identify botanical extracts for plant health in sub-saharan africa, Plants
  • Keip P., Ferre S., Gutierrez A., Huchard M., Silvie S., Martin P (2020), Practical Comparison of FCA Extensions to Model Indeterminate Value of Ternary Data, The 15th International Conference on Concept Lattices and Their Applications (CLA 2020). Tallinn, Estonia, 29-1/06-07/2020 –  https://agritrop.cirad.fr/596562/
  • Mahrach L., Gutierrez A., Huchard M., Keip P., Silvie P., Martin P (2020), Extraction of association rules from knowledge on plants with pesticidal and antibiotic effect classified by FCA for the One-Health initiative, JOBIM 2020
  • Keip Priscilla, Ouzerdine Amirouche, Huchard Marianne, Silvie Pierre, Martin Pierre (2019), Navigation conceptuelle dans une base de connaissances sur l’usage des plantes en santé animale et végétale, CORIA 2019, 16th French Information Retrieval Conference – https://agritrop.cirad.fr/593472/1/Keip_et_al_2019a.pdf
  • Bazin Alexandre, Carbonnel Jessie, Huchard Marianne, Kahn Giacomo, Keip Priscilla, Ouzerdine Amirouche(2019), On-demand Relational Concept Analysis, IFCA 2019https://arxiv.org/abs/1803.07847
  • Keip Priscilla, Gutierrez Alain, Huchard Marianne, Le Ber Florence, Sarter Samira, Silvie Pierre, Martin Pierre, Effects of input data formalisation in relational concept analysis for a data model with a ternary relation, International Conference on Formal Concept Analysis (ICFCA 2019) – https://link.springer.com/chapter/10.1007%2F978-3-030-21462-3_13