[Thèse soutenue] Sarah Valentin

[Thèse soutenue] Sarah Valentin: Extraction et agrégation d’informations issues de données multi-sources pour la veille internationale des maladies infectieuses animales

Sujet de thèse cofinancé par #DigitAg

Extraction et agrégation d’informations issues de données multi-sources pour la veille internationale des maladies infectieuses animales

Sujet de thèse labellisé par #DigitAg

Je suis doctorante au Cirad, à l’UMR TETIS. Vétérinaire de formation, après le Master2 Biostatistique, Biomathématiques, Bioinformatique et Santé (B3S) de l’Université Claude Bernard Lyon 1, j’ai démarré ce sujet de thèse, encadrée par encadrée par Mathieu Roche er Renaud Lancelot.

  • Date de démarrage : septembre 2017
  • Université : Montpellier Université d’Excellence, MUSE
  • Ecole doctorale :  I2S (Information, Structures, Systèmes)
  • Discipline / Spécialité :  Informatique, épidémiologie
  • Co-encadrants : Mathieu Roche (Cirad, UMR Tetis), Renaud Lancelot (Cirad, UMR Astre)
  • Financement : Cirad
  • #DigitAg : Thèse labellisée – Challenge 8 – Axes 4 et 5

Mots-clés : Intelligence épidémiologique, santé animale, données non-structurées, web

Résumé : La prévention et l’anticipation de l’introduction de dangers sanitaires sur un territoire repose en partie sur la détection précoce de l’émergence d’agents pathogènes à l’échelle mondiale. Au sein de la plateforme nationale d’épidémiosurveillance en santé animale (ESA), la cellule de « Veille sanitaire internationale » a ainsi pour mission d’identifier, de suivre et d’analyser les signaux de dangers sanitaires en santé animale menaçant le territoire français. En complémentarité des sources officielles d’informations sanitaires, un outil dédié à la veille automatique des dépêches issues des médias électroniques a été développé. Cet outil a pour but la détection, la collecte, la catégorisation et l’extraction de l’information sanitaire à partir des données textuelles non structurées publiées sur le web. Le projet de thèse consiste en premier lieu en l’évaluation rétrospective des performances de l’outil afin d’identifier les améliorations méthodologiques à mettre en œuvre. Il se concentrera ensuite sur l’identification, la combinaison et la qualification des informations et des indicateurs issus des données multi-sources pour l’identification de l’émergence des maladies animales.

Contact :  mathieu.roche [AT] cirad.fr – Tél: 07.81.89.28.50

Réseaux : LinkedInResearchGate

Communications & Publications

R. Goel, S. Valentin, A. Delaforge, S. Fadloun, A. Sallaberry, M. Roche, P. Poncelet (2020) EpidNews: Extracting, exploring and annotating news for monitoring animal diseases, Journal of Computer Languages

Valentin Sarah, Arsevska Elena, Falala Sylvain, De Goër Jocelyn, Lancelot Renaud, Mercier Alizé, Rabatel Julien, Roche Ma thieu. 2020. “PADI-web: A multilingual event-based surveillance system for monitoring animal infectious diseases ”. Computers and Electronics in Agriculture , 169, 105163, 5 p. https://doi.org/10.1016/j.compag.2019.105163

Rohan Goel, Samiha Fadloun, Sarah Valentin, Arnaud Sallaberry, Mathieu Roche, Pascal Poncelet (2018). EpidNews: An Epidemiological News Explorer for Monitoring Animal Diseases. VINCI ’18 Proceedings of the 11th International Symposium on Visual Information Communication and Interaction, Växjö, Sweden — August 13 – 15, 2018, pp 1-8 – https://doi.org/10.1145/3231622.3231624

Elena Arsevska, Sarah Valentin, Julien Rabatel, Jocelyn de Goër de Hervé, Sylvain Falala, Renaud Lancelot, Mathieu Roche (2018). Web monitoring of emerging animal infectious diseases integrated in the French Animal Health Epidemic Intelligence System. PLOS One – https://doi.org/10.1371/journal.pone.0199960

Sarah Valentin, Renaud Lancelot, Mathieu Roche  (2018). Surveillance automatisée de sources non-officielles pour la veille sanitaire internationale : évaluation rétrospective sur la fièvre aphteuse en Afrique. LIRIMA Workshop « Agriculture numérique en Afrique », Montpellier, France, 4 Avril 2018 – http://agritrop.cirad.fr/587790/

Sarah Valentin, Sylvain Falala, Jocelyn De Goër,Elena Arsevska, Julien Rabatel, Mathieu Roche, Renaud Lancelot (2018). An automatic animal diseases surveillance system based on textual media analysis. InnovSur 2018 : ‘INNOVATION in Health Surveillance’ International Forum, Montpellier, France, 16 Mai 2018 (poster) – http://agritrop.cirad.fr/588023/