Tests de dépistage du covid-19 : l'éclairage des probabilités conditionnelles - Lycée de la Côte d'Albâtre

Tests de dépistage du covid-19 : l’éclairage des probabilités conditionnelles

, par Grégory Roure - Format PDF Enregistrer au format PDF

 Un facteur déterminant : le taux de prévalence

Ce qui est plus étonnant et donne lieu régulièrement à des sujets de bac (trois exemples parmi ceux de la série S BAC S - Métropole - juin 2011, BAC S - Amérique du Sud - novembre 2015 et BAC S - Métropole - juin 2014), c’est que la pertinence ou non du recours massif à un test ne dépend pas uniquement de ses valeurs intrinsèques (sensibilité et spécificité), mais aussi de la prévalence de la maladie (la proportion de la population qui est infectée).

Prenons l’exemple du covid-19 avec un test unique RT-PCR et une prévalence du Covid-19 dans la population que nous noterons p (comprise mi-avril, entre moins de 1 % et 15 % selon les estimations et les régions).
Si on représente la situation par un tableau à double-entrée pour 10000 personnes avec un taux de prévalence de 3 %, une sensibilité de 60 % et un spécificité de 75 % :

simulation d’un test RT-PCR avec un taux de prévalence de 3%
porteursnon-porteurstotal
positifs 180 2425 2605
négatifs 120 7275 7395
total 300 9700 10000

On remarque que parmi les 2605 personnes diagnostiquées positives, seulement 180 seraient malades.
Cette probabilité, la probabilité d’être malade (ou porteur du virus , ou ayant été en contact avec le virus, selon le type de tests et de maladies) parmi les personnes positives est appelé la valeur diagnostique positive du test, notée généralement Vp (p) car elle dépend de la prévalence p de la maladie. Ici on obtient Vp(3 %)=180/2605 environ 7 %. Un tel test dans une population ne présentant que 3 % de personnes infectées n’a pas beaucoup d’intérêt pour diagnostiquer les personnes atteintes : On savait déjà que 40 % des malades avaient un diagnostic négatif, on découvre que 93 % des diagnostics positifs concernent des personnes non-malades.
Un tel test présente néanmoins un intérêt pour le dépistage, en effet sa valeur prédictive négative Vn(p), la probabilité qu’une personne diagnostiquée négative ne soit pas malade, est correcte lorsque très peu de personnes sont atteintes : Vn(3 %)=7275/7395 soit 98,4 %. Les personnes ayant un test négatif sont probablement saines (mais on s’en doute un peu lorsque la maladie touche seulement 3 % de la population).

Si on procède de même pour les tests recherchant les anticorps ou les antigènes avec une sensibilité de 70 % et une spécificité de 99 %, en gardant une prévalence de 3 % on obtient :

simulation d’un test de type recherche d’antigène ou d’anticorps avec un taux de prévalence de 3%
porteursnon-porteurstotal
positifs 210 97 307
négatifs 120 9603 9723
total 300 9700 10000

Ce qui donne Vp(3%)=210/307 environ 68 % ce qui devient intéressant et Vn(3%)=9603/9723 près de 98,8 % ce qui n’est pas tellement plus élevé qu’avec les tests RT-PCR.

En effet si on modélise la situation par un arbre pondéré (V et \overline{V}  : la personne porte ou non le virus ; TP et TN : le résultat du test est positif ou négatif) :

La probabilité qui correspond à la valeur diagnostique positive est donnée (en fonction de la prévalence p, selon ici une sensibilité de 60 % et une spécificité de 75%) par :

et la valeur diagnostique négative par :


Les courbes ci-dessous illustrent l’évolution de ces fonctions selon la prévalence p pour les deux tests ici étudiés.

On remarque que le test 1(RT-PCR) utilisé seul n’a pas une bonne valeur diagnostique positive, alors que le test 2 (type recherche d’anticorps ou d’antigènes) atteint 90 % lorsque la prévalence du virus est d’environ 10 % ce qui est déjà le cas (mi-avril) selon certaines estimations dans les zones les plus touchées.
La valeur diagnostique négative est en revanche correcte pour les deux tests dans les régions ou la présence du virus reste faible, et très moyenne dès que le virus infecte une large partie de la population.

Vous pouvez faire d’autres simulations en modifiant les paramètres ci-dessous ( vous pouvez notamment utiliser comme estimations (fin avril 2020) une sensibilité de 70% et une spécificité de 99% pour les tests RT-PCR et une sensibilité et une spécificité de 95% pour les tests sérologiques) :

Police pour dyslexie ?
Interlignage double ?