Accueil / Notions de base sur l’épidémiologie

Notions de base sur l’épidémiologie

Publié en ligne le 30 août 2009 - Statistiques et probabilité -

Pour étudier les effets d’une substance chimique ou d’un agent physique sur la santé, de quels outils scientifiques dispose-t-on ? Il y a deux approches possibles à notre disposition : les études expérimentales et les études épidémiologiques.

Dans les études expérimentales, deux groupes de cellules, d’animaux ou de volontaires sont comparés en laboratoire. L’un est exposé à la substance en question, l’autre non exposé, est dit « témoin » ou « contrôle ». Les échantillons sont homogènes, à part la présence ou l’absence de la substance à tester, ils sont placés dans les mêmes conditions de « vie » et sont comparables entre eux : même souche cellulaire ou même race d’animaux, même environnement physique (température, humidité, etc.), même conditions d’alimentation, même conditions d’examen… Tout est fait pour qu’un effet observé soit forcément dû au seul paramètre variable : la substance ou l’agent étudié. Le principal inconvénient de ces études est la validité de la transposition d’un effet observé sur des cellules ou sur des animaux à l’homme.

Les études épidémiologiques permettent d’observer les individus dans leur environnement. C’est un avantage puisque le problème de transposition du modèle biologique à l’homme dans son environnement habituel disparaît. C’est aussi un inconvénient puisque l’homme est étudié dans son environnement, complexe, dont il est difficile d’extraire le facteur d’exposition qui nous intéresse. Tout un chacun est exposé à de multiples facteurs potentiellement délétères pour la santé, et les études portent généralement sur un, voire deux facteurs, en négligeant les autres. Les maladies ayant toujours plusieurs causes (origine multifactorielle), les résultats des études épidémiologiques doivent être interprétés avec prudence pour éviter le risque d’attribuer à une mauvaise cause des effets constatés sur une partie d’une population donnée.

Qu’est-ce que l’épidémiologie ?

Parmi les définitions de l’épidémiologie, la plus utilisée est celle de l’Organisation Mondiale de la Santé (OMS) : c’est « l’étude de la distribution et des déterminants des états de santé et des maladies dans les populations humaines ainsi que des influences qui déterminent cette distri bution ». On distingue trois branches à cette discipline : l’épidémiologie descriptive, la plus ancienne, l’épidémiologie analytique, que nous détaillerons en dernier lieu pour mieux s’y attacher, et l’épidémiologie évaluative.

Scorbut et vitamine C

Au XVIIIe siècle, la marine britannique subit plus de pertes dues au scorbut (maladie liée à un déficit en vitamine C) que résultant de combats. Alors qu’il sert dans la Marine royale, un chirurgien du nom de James Lind réalise une expérience contrôlée à grande échelle sur les effets de l’alimentation sur des matelots atteints du scorbut et en publie les résultats en 1753 dans son livre, resté célèbre, A Treatise of the Scurvy. Lind recommande d’utiliser des agrumes pour traiter et prévenir le scorbut pendant les voyages en mer. Ce n’est pas avant 1795 que la Marine royale tiendra compte de ses conseils.

http://fr.wikipedia.org/wiki/Scorbut consulté le 31 octobre 2008.

L’épidémiologie descriptive donne des informations sur l’état de santé : description des cas de maladies dans une population en fonction du sexe, de l’âge. C’est le cas par exemple des statistiques de causes de mortalité enregistrées au niveau national par l’INSERM 1 ou des cas de cancers enregistrés par les registres départementaux des cancers. Ces études descriptives permettent de connaître l’incidence 2 des maladies et des causes de décès, ou de formuler des hypothèses. Par exemple, c’est l’enregistrement des statistiques de mortalité qui a permis, en 1952, de relier les pics de pollution atmosphérique à une augmentation de la mortalité cardio-respiratoire chez les personnes de plus de 65 ans, à Londres, lors d’un épisode de pollution atmosphérique 3.

L’épidémiologie évaluative permet d’évaluer une intervention de santé publique. Historiquement, on peut citer le traitement du scorbut dans la marine anglaise au milieu du XVIIIe siècle (voir encadré) ou le traitement de la fièvre puerpérale (infection grave des jeunes accouchées) par le lavage des mains décrit par Semmelweis 4 en 1847. De nos jours, des études d’épidémiologie évaluative ont permis, par exemple, de confirmer le bien-fondé de la prévention des maladies cardio-vasculaires par la prise d’aspirine à dose modérée. En fait, il s’agit d’une nouvelle étude descriptive pour évaluer le bien-fondé – ou non – d’une mesure prise pour améliorer l’état de santé.

Danger ou risque ?

Il y a danger quand un produit est capable d’altérer la santé humaine. Par exemple l’arsenic est dangereux. Il y a risque sanitaire quand une personne est exposée à un produit dangereux. Si une personne ingère de l’arsenic, elle risque d’être malade. Si elle n’en ingère pas, elle ne court aucun risque. Le risque est donc le produit d’un danger et d’une exposition : il existe des dangers sans risque ; il n’y a pas de risque sans danger.

L’épidémiologie analytique va permettre de tester la véracité des hypothèses posées lors des études descriptives ou analytiques précédentes. Ces études sont mises en place pour rechercher les facteurs de risques des maladies. Une étude épidémiologique dans ce cadre doit respecter un certain nombre d’étapes qui sont : la définition de l’hypothèse à tester, le protocole de l’étude, la méthode de recueil des données, l’analyse statistique, l’interprétation des résultats et la recherche d’une relation de causalité.

L’épidémiologie analytique

L’étude a pour but de rechercher une relation entre une maladie M et un facteur de risque FR. On appelle facteur de risque tout facteur statistiquement lié à une maladie. Il peut s’agir d’un facteur augmentant le risque (ex. : le tabac est un facteur de risque pour le cancer du poumon) ou d’un facteur réduisant le risque (encore appelé facteur protecteur ; ex. : l’exercice physique est un facteur protecteur contre les maladies cardiovasculaires).

L’étude est basée sur une hypothèse de départ. Par exemple, pour savoir s’il existe une relation entre le cancer du poumon et le tabac, l’hypothèse à tester va être : « le tabagisme augmente le risque de cancer du poumon ». Cette relation va être « mesurée » par le risque relatif (RR) qui est égal à la fréquence de la maladie (le cancer du poumon) dans le groupe exposé (les fumeurs) sur la fréquence de la maladie (le cancer du poumon) dans le groupe non exposé (les non-fumeurs). Un RR égal à 1 signifie qu’il n’y a pas de relation entre la maladie et le facteur étudié. On voit tout de suite qu’une question importante est de savoir comment « classer » les personnes : à partir de combien de cigarettes par jour est-on classé dans le groupe des fumeurs ? Dans quel groupe va-t-on classer les personnes qui ont arrêté de fumer ? Qu’en est-il des personnes qui ont arrêté il y a 6 mois par rapport à celles qui ont arrêté il y 5 ou 10 ans ? Etc. Autant de risques d’erreur de classement des sujets…

L’étape suivante va être de préciser le protocole de l’étude. Parmi les multiples types d’études possibles, nous en décrirons deux : l’étude de cohorte et l’étude cas-témoin, adaptées à l’étude des facteurs de risque des cancers.

L’étude de cohorte, dans cet exemple, va considérer un groupe de fumeurs et un groupe de non-fumeurs (tels que définis au départ) et les suivre pendant un certain temps. Dans chaque groupe, on relèvera le nombre de personnes atteintes d’un cancer du poumon et l’on pourra calculer le risque relatif (RR). Ce type d’étude est peu utilisé dans le cas des cancers car il s’agit de maladies dont le délai d’apparition est long après l’exposition (10 à 20 ans dans l’exemple donné) et il est très difficile de suivre une population aussi longtemps sans avoir de « perdus de vue », c’est-à-dire des personnes dont on n’a pas de nouvelles à la fin de l’étude sans savoir si elles ont développé la maladie ou non. Par ailleurs, ce type d’étude nécessite des effectifs nombreux. Il s’agit donc d’études longues, coûteuses et difficiles.

L’étude cas-témoin est plus facile à mettre en œuvre. Elle consiste à comparer un groupe de malades (des personnes atteintes de cancer du poumon) et un groupe de personnes indemnes de cette maladie, les témoins. Dans ce cas, c’est l’exposition des malades que l’on va comparer à celle des témoins. Ce type d’étude est plus facile à réaliser, mais plus délicate à analyser. La première grande difficulté consiste à trouver les « bons » témoins, c’est-à-dire ceux qui ressemblent autant que possible aux cas (sexe, âge, profession, habitat, habitudes de vie, etc.). La seconde est que l’on fait appel à la mémoire des personnes pour connaître les expositions passées.

Le risque relatif, qui représente la force de l’association entre le facteur de risque étudié et la maladie, est entouré d’un intervalle de confiance (IC) dont l’étendue donne une idée de la précision de l’étude : plus l’IC est petit, plus l’étude est fiable. Si cet intervalle ne contient pas la valeur 1, on dit qu’il y a une relation statistiquement significative entre le facteur de risque étudié (FR) et la maladie (étude positive dans le langage courant). Sinon, on ne peut pas conclure (étude négative dans le langage courant).

Corrélation n’est pas causalité

La relation de causalité s’effectue à travers plusieurs critères dont aucun n’est nécessaire, aucun n’est suffisant. Ces critères sont :
 La force de l’association, appréciée par le niveau de risque relatif. Dans le cas du tabac et du cancer du poumon, le risque relatif (RR) est de l’ordre de 10 à 20, c’est-à-dire qu’une personne qui a fumé un paquet de cigarettes par jour pendant 20 ans a 10 à 20 fois plus de risques de développer un cancer du poumon qu’une personne qui n’a jamais fumé.
 La constance des résultats. Cela veut dire qu’il est nécessaire d’avoir plusieurs études, dont les résultats vont dans le même sens.
 La spécificité de l’effet. Un même facteur est relié à une même maladie, dans plusieurs études différentes.
 L’exposition doit précéder la maladie, dans un délai cohérent avec ce que l’on sait de l’histoire de cette maladie (par exemple 10 à 20 ans dans le cas du cancer du poumon lié au tabagisme).
 L’existence d’une relation dose-effet. C’est-à-dire que plus l’exposition augmente, plus le risque de développer la maladie augmente.
 L’existence de données biologiques et expérimentales plausibles : si les résultats des études expérimentales in vitro mettent en évidence un mécanisme d’action, si les études in vivo retrouvent la même pathologie chez l’animal, c’est un argument en faveur de la relation de causalité.

Il faut aussi s’assurer que le risque étudié n’est pas lié à un autre facteur de risque connu qui pourrait expliquer la relation statistique mise en évidence (facteur de confusion). Les autres facteurs de risques doivent donc être pris en compte… ce qui suppose qu’on les connaisse.


Une fois la relation statistique établie, il faut encore rechercher la notion de causalité, c’est-à-dire si ce facteur de risque est bien en cause dans la maladie. En effet, association statistique ne veut pas dire relation de cause à effet. Par exemple, le nombre de naissances a diminué fortement entre 1965 et 1980 en République Fédérale d’Allemagne, de même que le nombre de cigognes traversant le pays en période migratoire. Bien qu’une relation statistiquement significative entre les deux phénomènes ait été établie, il ne s’agit bien évidemment pas d’une relation de cause à effet (voir encadré).

Ainsi, l’interprétation d’une étude épidémiologique est délicate, même si les résultats semblent faciles à comprendre. Il s’agit d’une discussion d’experts car chaque étude a ses forces et ses limites. Il faut tenir compte des biais méthodologiques inhérents à toute étude (erreurs de classement, facteurs de confusion, etc.), faire la différence entre relation statistique et relation causale et bien connaître les études antérieures sur le sujet.

Ce qu’il faut retenir : une étude à elle seule ne détient pas la vérité, il faut toujours la replacer dans le contexte de la recherche et l’intégrer aux résultats antérieurs.

1 Institut national de la santé et de la recherche médicale.

2 Incidence : nombre de nouveaux cas de maladie rapporté à une population donnée (par exemple la population française) pendant une période de temps (en général une année). À ne pas confondre avec la prévalence qui est le nombre total de cas (les nouveaux et les anciens) dans une population donnée et sur une période de temps donnée.

3 JA Scott. “Fog and deaths London, December 1952”. Public Health Reports, 1953, 68 (5) : 474-479.
ML Bell, DL Davis, T Fletcher. “A retrospective assessment of mortality from the London smog episode of 1952 : the role of influenza and pollution”. Environmental Health Perspectives, 2004, 112 : 6-8.

4 P Semmelweis. « A gyermekagyi láz koroktana » (L’étiologie de la fièvre puerpérale). Orvosi hétilap, 1858 ; no. 1 : 1-5 ; no. 2 : 17-21 ; no. 5, 65-69 ; no. 6 : 81-84 ; no. 21 : 321-326 ; no. 22 : 337-342 ; no. 23 : 353-359. (Première publication de ses idées).
IP Semmelweis. Die Aetiologie, der Begriff und die Prophylaxis des Kindbettfiebers. Pest-Wien-Leipzig, 1861. Réimprimé avec une nouvelle introduction par A. F. Guttmacher. New York-London, 1966. http://fr.wikipedia.org/wiki/Ignace..., consulté le 31 octobre 2008.

Publié dans le n° 286 de la revue


Partager cet article


L' auteur

Martine Souques

Médecin de santé publique et épidémiologiste, en charge de l’évaluation des risques sanitaires et environnementaux (...)

Plus d'informations