Les débuts calculés de l'épidémie de coronavirus
Des analyses de données génomiques accessibles au public fournissent des indices sur les débuts de l'épidémie de coronavirus en Chine. Des chercheurs du Département des systèmes biologiques de l'ETH Zurich à B?le ont utilisé pour cela un modèle statistique qu'ils ont développé ces dernières années.
Depuis le début de l'épidémie actuelle de coronavirus, les scientifiques et les autorités ont déterminé l'empreinte génétique d'échantillons de virus provenant de nombreux pays touchés. Plus de 100 de ces séquences génétiques, présentes dans les coronavirus sous forme d'ARN, sont disponibles dans des bases de données publiques. Tanja Stadler, professeure de biologie computationnelle au Département des systèmes biologiques de l'ETH Zurich à B?le et spécialiste des questions d'épidémiologie moléculaire, a maintenant analysé ces données. Elle a utilisé pour cela un modèle statistique développé dans son groupe pour l'analyse génétique de l'arbre généalogique des agents pathogènes et a ainsi obtenu de nouvelles informations sur les débuts de l'épidémie en Chine.
Les évaluations de Stadler suggèrent que l'épidémie en Chine a débuté durant la première quinzaine de novembre 2019. La plupart des estimations précédentes supposaient que le virus n'était passé d'un animal à un premier humain que durant la deuxième quinzaine de novembre. "L'hypothèse répandue selon laquelle le premier humain a été infecté en novembre sur un marché d'animaux est toujours plausible", explique la professeure de l'ETH. "Nos données excluent avec une très grande probabilité que le virus ait circulé chez les humains pendant une longue période avant cette date".
Propagation rapide avant la quarantaine
Stadler a en outre analysé la dynamique de l'épidémie avant que la ville de Wuhan ne soit placée en quarantaine le 23 janvier 2020. A partir des données génétiques, la scientifique a calculé le nombre de reproduction de base du nouveau coronavirus. Ce chiffre indique combien de personnes une personne infectée contamine en moyenne. Selon les estimations de Stadler, il se situe entre 2 et 3,5 pour la période en question. La chercheuse confirme ainsi les estimations précédentes, qui se basaient sur le nombre de cas de Corona confirmés et partaient d'un chiffre compris entre 2 et 4. Cela signifie que les contaminations sont nettement plus rapides que dans le cas de la grippe saisonnière (avec un nombre de reproduction de base typiquement inférieur à 1,5).
"Le taux de reproduction de base est l'un des paramètres centraux d'une épidémie", explique Stadler. "Il fournit des indications importantes sur l'efficacité de mesures telles que la mise en quarantaine. Pour la scientifique, il serait donc intéressant de pouvoir déterminer ce chiffre pendant la quarantaine de Wuhan. Toutefois, les données disponibles pour cette période à Wuhan sont confuses, ce qui rend une analyse fiable impossible pour le moment, explique Stadler.
Chiffre noir calculé
Les génomes des virus se modifient en permanence. En se basant sur ces modifications, Stadler a reconstruit l'arbre généalogique génétique du virus. "Gr?ce à des méthodes statistiques, nous pouvons calculer, pour chaque moment du passé, combien de personnes étaient alors infectées", explique Stadler. Cette analyse a révélé que le 23 janvier, entre 4000 et 19 000 personnes avaient déjà été contaminées. A ce moment-là, il y avait 581 cas de maladie confirmés. Cela signifie que dans le cas le plus extrême, seule 1 personne infectée sur 33 apparaissait dans les statistiques officielles, et dans le meilleur des cas, 1 personne sur 7.
Stadler souligne qu'il existe d'autres méthodes que la sienne pour déterminer des paramètres épidémiologiques. Leur méthode, qui analyse les génomes, a toutefois le grand avantage de permettre de tirer des conclusions fiables même avec des données provenant de relativement peu de patients. Sa méthode présenterait notamment des avantages dans les situations où l'on ne sait plus très bien qui a contaminé qui. C'est actuellement le cas en Italie, notre pays voisin, et depuis longtemps en Chine.
Une analyse en temps réel serait possible
Enfin, leur méthode permettrait même d'analyser une épidémie en temps réel. Les autorités pourraient ainsi contr?ler et adapter en permanence l'efficacité des mesures de lutte. Pour cela, il faudrait que le génome du virus soit déterminé chez les personnes nouvellement infectées par des prélèvements réguliers. Cependant, peu de données de séquences de génomes viraux sont actuellement publiées à Wuhan.
Stadler et ses collègues ont rendu leur analyse accessible à d'autres scientifiques sur le portail spécialisé "Virological". Les chercheurs de l'ETH soulignent que leur travail n'a toutefois pas été évalué par d'autres scientifiques, comme c'est en principe la norme dans la recherche. Dans une situation actuelle comme celle-ci, cela prendrait trop de temps. De même, la professeure de l'ETH souligne que la qualité de son analyse ne peut être qu'aussi bonne que la qualité et le nombre des données génétiques publiées. Dans cette étude, 93 séquences d'ARN ont été analysées, dont la majorité provient de Chine et 38 d'autres pays. Stadler poursuivra son analyse afin d'élargir les données génomiques récemment publiées.
Référence bibliographique
Scire J, Vaughan T, Stadler T : page externeAnalyses phylodynamiques basées sur 93 génomes, mis en ligne le 25 février 2020 sur virological.org