[Doctorant] Romain Gautron

[Doctorant] Romain Gautron: Apprentissage par renforcement pour l’agriculture des pays en voie de développement

Sujet de thèse labellisé par #DigitAg

Apprentissage par renforcement pour l’agriculture des pays en voie de développement: un conseiller virtuel pour la maîtrise du risque et une optimisation multi-objectifs

  • Date de démarrage : janvier 2019
  • Université : Montpellier MUSE / Montpellier SupAgro
  • Ecole doctorale : GAIA
  • Discipline / Spécialité : Agronomie, Informatique
  • Directeur(s) de thèse : Marc Corbeels, Cirad AIDA / Philippe Preux, Inria Lille, Sequel
  • Encadrant(es) : Eric Malezieux, Cirad HortSys / Odalric Ambrym Maillard, Inria Lille, Sequel
  • Financement : Cirad – CGIAR
  • #DigitAg : Thèse labellisée – Axe 1 : Impact des technologies de l’information et de la communication sur le monde rural, Challenge 5 : Les services de conseil agricole

Mots-clés: Intelligence artificielle ; apprentissage par renforcement ; petits agriculteurs ; pays du Sud ; pays en voie de développement ; système de recommandation ; itinéraires de culture ; serveur vocal interactif ; smartphone ; crowdsourcing

Résumé : L’apprentissage par renforcement (AR) a montré de spectaculaires progrès ces dernières années, plus particulièrement combiné aux techniques d’apprentissage profond pour le jeu de go avec l’algorithme AlphaGo de Deepmind (https://deepmind.com/blog/alphago-zero-learning-scratch/). Bien qu’appliqués aux secteurs du marketing et pharmaceutique, les solutions d’AR ont été très peu explorées pour l’agriculture (voir travaux de F. Garcia). Pourtant, la conduite des cultures est une séquence de choix dans l’incertain, rendant l’AR d’autant plus pertinent. Avec l’émergence de collectes d’informations de tailles plus importantes à différentes échelles comme les images satellitaires, les capteurs au sol et les retours d’informations des utilisateurs par serveur vocal interactif (SVI), une nouvelle donne d’apprentissage actif et en ligne émerge, rendant l’AR d’autant plus pertinent.

Les systèmes d’aide à la prise de décision actuels utilisent des règles de décision statiques (type si-alors-sinon) employant des modèles statistiques complétés par des données agronomiques et mesurées sur les fermes, des images satellitaires et des sorties de modèles d’apprentissage automatique. Ces règles tendent à être spécifiques à une tâche donnée (ex. irrigation, fertilisation), n’incluent pas l’ensemble de la séquence de décision, le profil de l’agriculteur, une optimisation multi-objectifs (économique, environnemental et social) ou bien encore ne tiennent pas compte de la stochasticité de l’environnement (quantification du risque). Pourtant, ces composantes sont importantes pour délivrer des recommandations agronomiques pertinentes, sûres et personnalisées. Ces objectifs sont atteignables grâce à l’AR.

Les techniques d’AR permettent de prendre en compte l’incertain de l’impact des choix (comme ceux effectués au cours de l’itinéraire de culture) et des événements stochastiques (comme les maladies, ravageurs ou la météo). Avec les approches dites modèle-libres, les problèmes trop complexes pour être décrits explicitement (dans notre cas l’ensemble de l’itinéraire de culture) peuvent être résolus en apprenant directement par interaction avec l’environnement d’apprentissage (i.e. en essayant la meilleure action espérée dans le monde réel). C’est un cadre d’apprentissage par essais-erreurs: une recommandation est donnée, puis son impact (appelé “récompense”) est évaluée et les futures recommandations données selon les expériences passées. On considère la séquence de choix passés, et également l’ensemble des futurs choix possibles afin de maximiser, en espérance et dans un environnement stochastique, la récompense. Ces techniques permettent également d’apprendre des données historiques (ex. sol, données propres à la culture, données climatiques), reliant celles-ci à ce que l’on appelle un “contexte”, rendant l’apprentissage plus riche et rapide tout en quantifiant le risque lié à une recommandation.

Dans un premier temps, ce doctorat vise à concevoir des algorithmes avec des techniques issues de l’état de l’art et adaptées à la prise de décision pour les itinéraires de culture, offrant aux agriculteurs des conseils s’améliorant de manière continue, et plus particulièrement dans les pays en voie de développement aux contextes de données pauvres. Ce sujet transverse mobilisera l’expertise de l’équipe SequeL d’Inria pour l’AR combinée à celle des agronomes du CIAT, Cirad et d’autres organismes de développement rural des pays du Sud. Nous souhaitons construire un système d’AR novateur offrant des recommandations de pratiques agronomiques personnalisées, en temps réel et avec une quantification du risque. L’optimisation intégrera des objectifs économiques, sociaux et environnementaux (ex. rendement et conservation du sol).  Le système sera accessible par SVI ou bien encore via une application pour smartphone. Il s’agit d’un assistant virtuel en auto-apprentissage par ses expériences (recommandation passées suivies d’un retour d’information par les agriculteurs) tout en s’appuyant sur ses connaissances (données historiques). Les recommandations sont données selon l’espace, le temps et le profil individuel de l’agriculteur. Par exemple, une recommandation pourrait être de la forme “Le meilleur choix espéré pour maximiser vos objectifs est de semer la variété x la semaine y d’Août à une densité de z plantes par hectares”.

Dans un second temps, après que les algorithmes ont été testés in silico et soient prêts à l’emploi, des essais en conditions réelles vont avoir lieu avec des petits agriculteurs du Malawi. Les jeux de données disponibles consistent en des données intégrées multi-dimensionnellement comprenant localisation, indice de végétation différentielle normalisée, précipitations, températures, sols, usages de terres et données historiques de productivité des cultures, ainsi que des images satellitaires infra-métriques issues des archives Digital Globe. Les images satellitaires infra-métriques permettront de délimiter les zones d’intérêt, et les facteurs limitant pour le maïs, pour l’ensemble du Malawi. Les tests seront conduits à travers le système de recommandations agronomiques existant AirTel/Viamo M’Chikumbe via SVI qui comprend déjà 726 000 petits agriculteurs inscris au Malawi, mais dont la qualité des recommandations est moindre. Ce système offre un puissant moyen d’interagir directement avec chaque agriculteur via leurs téléphones portables et de fournir des conseils sur-mesure à travers le pays entier. Si les expérimentations sont concluantes, les techniques et méthodes développées dans ce doctorat pourront être étendues à d’autres lieux comme par exemple en Colombie, au Nigeria ou encore en Inde: c’est-à-dire à des millions de petits agriculteurs.

Contact : r.gautron@cgiar.org

Réseaux : LinkedIn

Site personnel : https://romaingautron.fr/