Skip to main content

COCOTIA

analyse de COdes-BArres génétiques pour COmprendre la Transmission locale de Plasmodium par des méthodes IA

Le projet COCOTIA a pour objectif d'éclairer la transmission inter-individuelle et communautaire de Plasmodium à l'échelle locale (ménage, village) en intégrant l’intelligence artificielle, l’épidémiologie génétique et géo-épidémiologie pour répondre aux questions suivantes :

  1. Les génotypes parasitaires détectés dans les infections cliniques sont-ils représentatifs de la diversité génétique des villages, ou bien les cas symptomatiques présentent-ils des génotypes distincts ? Le cas échéant, sont-ils locaux ou majoritairement importés ? Comment se diffusent-ils dans les villages durant la saison de transmission ?
  2. Peut-on définir des groupes d'individus infectés par le même lignage de parasites, traduisant une source de transmission commune, à l'échelle d'un ménage ou de leur voisinage proche ? Sont-ils associés à des hotspots de cas incidents ? Quels sont les facteurs (distance géographique, temporelle, appartenance au même ménage, âge, sexe…) qui permettent le mieux de prédire l'infection par un génotype/lignage identique ? 
Project period
-
Main investigator

Jordi Landier, Raquel Ureña, Antoine Claessens

SESSTIM member(s) of the project:
Non-SESSTIM member(s) of the project

Antoine CLAESSENS, LPHI, Montpellier

Sponsors:

Institut Laennec

Partners:

LPHI, Université de Montpellier, CNRS, Inserm

Research question:

La transmission de Plasmodium falciparum persiste dans la région sahélienne, en dépit de la généralisation de l'utilisation des moustiquaires imprégnées d’insecticide et d'une amélioration de l'accès au soin. Dans cette région, la transmission est saisonnière et les cas se concentrent sur 4 à 6 mois, durant la saison des pluies. A l'inverse, peu de cas surviennent en saison sèche. Durant cette saison, en l'absence quasi-totale de vecteurs, P. falciparum persiste chez certains individus sous forme de portage asymptomatique. Des stratégies de lutte contre le portage asymptomatique sont à l'étude pour compléter la lutte anti-vectorielle et réduire plus efficacement la transmission. 
Il est nécessaire de mieux comprendre ce portage asymptomatique de Plasmodium pour intervenir efficacement. L'épidémiologie permet d'identifier les individus porteurs d'infections et les facteurs de risque. L'épidémiologie génétique, basée sur la caractérisation génomique de la population locale de Plasmodium, permettrait une compréhension approfondie de la structure et de la dynamique du réservoir de Plasmodium et des relations entre portage, transmission et épisodes cliniques. Par l'analyse des chaines de transmission, elle permettrait aussi de compléter la description de l'épidémiologie de Plasmodium en retraçant précisément la circulation inter-individuelle du parasite. Le recours à des méthodes d'analyse par intelligence artificielle se justifie par la nécessité d'analyser les relations de distance génétique entre chaque paire de parasites génotypés, entrainant une quantité massive de données.

CE PROJET RECRUTE UN.E POSTDOC : https://academicpositions.com/ad/aix-marseille-universite/2024/24-month-post-doc-position-investigating-plasmodium-falciparum-reservoir-genetic-epidemiology-in-sahelian-west-africa-funded-by-amidex/215076

Method:

Données
Ce projet s'appuie sur les données génétiques obtenues à partir d'échantillons collectés sur le terrain lors d'une étude de cohorte conduite d'Avril 2021 à Mars 2022 au Sénégal et au Mali dans le cadre du projet MARS (Malaria Asymptomatic Reservoir in the Sahel: https://sesstim.univ-amu.fr/fr/projet/mars). Plus de 1500 échantillons positifs pour Plasmodium falciparum ont été collectés durant le suivi, correspondant pour à des porteurs asymptomatiques et à des épisodes cliniques. Le génotypage des échantillons asymptomatiques et cliniques est en cours effectué en partenariat avec le programme MalariaGEN (https://www.malariagen.net/parasite/spotmalaria) de l'Institut Sanger depuis mai 2023. Les résultats rendus par MalariaGEN se composent d'une série standardisée d'indicateurs, incluant les différentes espèces détectées, la multiplicité d'infection, la détection de 17 marqueurs génétique de résistance aux antipaludiques, et un code-barre de 101 Single Nucleotide Polymorphism (SNP). Lorsque la quantité de matériel est suffisante, le séquençage génome entier (WGS) est également réalisé.

Méthodologie
La méthodologie multidisciplinaire proposée pour ce projet intègre des techniques d'analyse génétique, statistique et d'apprentissage automatique, et se compose de trois étapes principales : 

  1. Obtention de la distance génetique et l’appartenance au linage (analyse génetique) 
  2. Analyse de la diversité génétique des parasites Plasmodium et des facteurs associés, (statistiques, statistiques spatiales et apprentissage non supervisé) 
  3. Prédiction de la distance génétique entre les paires de génotypes (machine learning et apprentissage supervisé)

 

Research prospects:

Les travaux proposés n'ont jamais été réalisés à une telle échelle locale à propos du paludisme. Ils présentent donc un intérêt de nouveauté et de preuve de concept pour l'utilisation de données génomiques massives pour la compréhension épidémiologique à l'échelle locale grâce aux techniques de machine learning. 
De nombreux bailleurs de fonds internationaux financent l'équipement d'infrastructures permettant la production de données génétiques sur les maladies infectieuses dans les pays endémiques (notamment en réponse à la pandémie de COVID-19 – projet Afroscreen financé par l'AFD – et pour la surveillance des zoonoses émergentes...).  Pour le paludisme, l'enjeu principal est le suivi des résistances aux antipaludiques. Cependant, l'évolution de la structure génétique des populations de Plasmodium représente aussi un marqueur de l'évolution de la transmission qui permet d'anticiper l'efficacité des interventions2. Il y a plus généralement un intérêt à participer au renforcement des outils et des capacités pour l'exploitation de ces données, appelées à se multiplier à l'avenir.

Les résultats qui seront obtenus ont une portée opérationnelle importante, car ils permettront de mieux concevoir des interventions et leur ciblage. Comprendre la répartition spatiale et temporelle des cas secondaires issus d'un cas index permet de dimensionner des interventions réactives en population dans un contexte d'élimination. Cela permet également de cibler certains profils d'individus : ceux qui contribuent de façon disproportionnée à la transmission ("super-spreaders"); ceux qui ont une probabilité élevée de rester porteurs asymptomatiques au travers de la saison sèche et de représenter un réservoir initial de transmission… Enfin, la compréhension et le suivi des dynamiques locales de circulation de Plasmodium est un enjeu majeur dans la perspective de stratégies d'élimination, pour lesquelles il faut comprendre l'origine et les mécanismes permettant les résurgences de paludisme.