Accueil / La qualité de la preuve en médecine

La qualité de la preuve en médecine

Publié en ligne le 6 mars 2019 - Médecine -
De nombreux sujets relatifs à la santé font l’objet de controverses largement médiatisées où une place de choix est accordée au témoignage et à l’émotion au détriment de l’état réel de la connaissance scientifique. Quand la science est invoquée, très souvent, les différents points de vue exprimés invoquent à l’appui « une nouvelle étude qui dit que », « des preuves qui commencent à s’accumuler ». Dans ce contexte, comment un citoyen ordinaire pourrait-il se faire une opinion ? Qui croire ? Que croire ?

Qui croire ?

Il peut sembler paradoxal d’employer ici le verbe « croire ». En effet, la science n’est-elle pas une affaire de faits et non de croyances ? Mais, pour le grand public, et même pour le scientifique dès lors qu’il aborde un sujet hors de son domaine de compétence, il n’est pas possible de tout savoir ou de tout vérifier. S’opère alors un glissement : à défaut de contrôler directement l’affirmation, c’est sur la source de l’information que va porter le jugement, ce que le sociologue Gérald Bronner appelle une « croyance par délégation » [1]. Quelle source semblera la plus crédible, la plus digne de confiance : les journalistes ? les responsables politiques ? les institutions scientifiques ? les agences sanitaires ? les industriels du secteur concerné ? les réseaux sociaux ? ses proches ? les ONG ? son médecin traitant ?

Il n’y a, bien entendu, pas de réponse simple et universelle. Cela va dépendre de la nature de la question posée. Mais dès lors qu’on s’intéresse à l’état des connaissances scientifiques sur un sujet de santé, il existe une boussole pour se retrouver devant ce qui, très souvent, peut apparaître comme une cacophonie. Elle met en avant une hiérarchie de niveaux de preuve, une pyramide de la qualité de la preuve.


Les niveaux de preuve

La médecine moderne, celle qu’on appelle « médecine fondée sur les preuves » (evidence-based medecine), s’est constituée en s’affranchissant de la subjectivité du patient et de celle du médecin. Elle cherche d’abord à objectiver les faits pour pouvoir ensuite les vérifier rigoureusement puis les expliquer.

Le témoignage

Dans ce cadre-là, le témoignage, quelle qu’en soit la source, n’a aucune valeur de preuve. Celui du patient doit bien entendu être écouté : il est sans doute le mieux placé pour exprimer sa souffrance, pour évoquer ce qu’il ressent. L’expérience du médecin compte également. Le témoignage peut suggérer la mise en œuvre d’études. Mais dès lors qu’il s’agit d’établir des faits, il faut s’affranchir de la subjectivité des expériences individuelles. Ainsi, pendant très longtemps, les médecins s’accordaient sur l’efficacité des saignées et les patients étaient convaincus des bienfaits de toutes sortes de pratiques qui, aujourd’hui, sont clairement considérées comme sans effet (voire dangereuses pour certaines) suite à des expérimentations scientifiquement contrôlées. De nos jours encore, le témoignage joue un rôle très fort. De nombreux reportages à fort impact médiatique s’appuient largement sur eux : la charge émotionnelle des propos d’un patient qui désigne la cause perçue de ses troubles ou affirme l’efficacité d’une thérapie est bien difficile à contester sans sembler remettre en cause sa souffrance et sa bonne foi.

Les différents types d’étude

Il faut donc passer du témoignage ou de l’impression à l’objectivation. Deux principaux types d’études sont mis en œuvre :

  • dans les études observationnelles, les chercheurs observent sans modifier ; ce sont les études transversales (on analyse une population à un instant donné), les études de cohorte (ou études longitudinales où l’on suit l’évolution d’une population dans le temps) et les études cas-témoins (études rétrospectives qui partent de la maladie et cherchent à remonter aux causes) ;
  • dans les études expérimentales, les chercheurs interviennent pour modifier des conditions et observer les conséquences (ce sont en particulier les essais cliniques, essais comparatifs où l’on compare des personnes traitées à un groupe témoin).

Ces différents types d’études ont chacun leurs propriétés propres, leurs avantages et leurs inconvénients, et le choix dépend de l’objectif recherché, des délais impartis, de considérations éthiques et du niveau de connaissance déjà atteint.

Mais ce sont les études expérimentales qui apportent le meilleur niveau de preuve. Dans tous les systèmes de gradation, dans toutes les échelles de qualité de la preuve, elles occupent une place centrale. Elles doivent cependant obéir à des règles méthodologiques strictes. Apparus il y a plus de deux siècles [2], et largement affinés depuis, les « essais contrôlés, randomisés en double aveugle » forment ainsi le socle de l’évaluation moderne en médecine. L’idée est de contrôler de façon précise l’effet d’un traitement ou d’une prise en charge, « toutes choses égales par ailleurs » (par comparaison à un groupe contrôle constitué au hasard – randomisé), en s’affranchissant de l’influence des attentes et croyances du patient et du médecin (ni le premier ni le second ne sait s’il donne ou reçoit le produit testé ou un placebo – double aveugle).

Le Dr. Hersey menant une étude d’infectiosité, 1980.
CDC (Centers for Disease Control)


Réplication et confirmation

Bien entendu, « une hirondelle ne fait pas le printemps » et une simple étude ne fait pas la vérité en médecine. Une étude isolée peut produire un résultat erroné, c’est l’avancement normal de la science : sa publication est une invitation adressée aux pairs pour vérifier, reproduire ou infirmer le résultat obtenu. La science procède par essais et erreurs. Malheureusement, biais, embellissements des études, sélections de données, voire fraudes parfois, sont également présentes (et malheureusement trop fréquentes [3]), obligeant à rester très prudents face à des résultats non reproduits ou non confirmés. Ainsi, une analyse portant sur trois domaines médicaux évalue à 60 % la part des études initiales, publiées dans des revues à comité de lecture, dont les résultats seront finalement invalidés par la suite [4].

Reproduits et répliqués par d’autres chercheurs, les résultats tendent à devenir plus solides. Des études sur de grandes populations apportent un degré supplémentaire de confirmation. Des « méta-analyses » (ou revues de synthèse) considèrent toutes les études produites sur un sujet donné, écartent celles de qualité insuffisante (par exemple sans groupe de contrôle, sans double aveugle ou avec des erreurs méthodologiques) et produisent une synthèse chiffrée des résultats.

Ainsi, une pyramide de la qualité des preuves (voir par exemple [5]) s’est progressivement imposée. Adoptée sous des formes proches les unes des autres 1, par toutes les agences sanitaires, elle met tout en haut les méta-analyses.

Les avis des agences sanitaires

Ajoutons, pour terminer, que le commun des mortels, pas plus que les décideurs politiques, n’a les compétences nécessaires pour comprendre les études scientifiques ou les métaanalyses, souvent très techniques, et en tirer les conclusions pratiques (extrapolation de l’animal à l’Homme, portée des expériences in vitro, différence entre danger et risque, qualité de l’évaluation de l’exposition, etc.). Un des rôles des agences sanitaires est justement de compiler cette connaissance accumulée. Elles ne conduisent pas de nouvelles expériences mais examinent la littérature scientifique publiée sur un sujet donné et les niveaux de preuves associés, pour procéder à une analyse collective visant à émettre des recommandations à l’attention des pouvoirs publics.

Étude sur les organismes bactériens
(Dr. P.R. Edwards et G. Herman), entre 1948 et 1963. CDC


Comment exercer son esprit critique ?

Bien entendu, cette description est un peu simplifiée. La réalité est plus complexe. Mais cette pyramide des niveaux de preuves est un outil qui permet de s’y retrouver en première approximation. Face à un sujet présenté comme controversé dans les médias, il faut systématiquement se demander « quel est le niveau de preuve ? » (rarement indiqué par les journalistes). Le bon réflexe est de ne pas se laisser envahir par l’émotion et les témoignages, ne pas se laisser impressionner par l’affirmation souvent assénée selon laquelle « une étude nouvelle dit que » et se demander s’il existe une littérature de synthèse sur le sujet, si les agences sanitaires ont examiné la question et éventuellement si, à l’échelle internationale, elles émettent des avis convergents. Bien entendu, cette méthode n’est pas infaillible, mais elle constitue la meilleure boussole disponible. Certes, les agences sanitaires sont imparfaites, il y a des biais, des erreurs, parfois des cas de corruption 2. Mais ceci doit nous inciter à revendiquer un renforcement de la transparence et de la qualité de l’expertise, et non pas à discréditer l’expertise en général et le principe d’une mission de service public de l’expertise en particulier 3.

1 Signalons ainsi le référentiel GRADE (The Grading of Recommendations Assessment, Development and Evaluation), outil élaboré par un groupe de travail international, qui permet d’évaluer le niveau de preuve des études et de définir la force des recommandations. Il a été adopté par de nombreuses institutions nationales ou internationales produisant des recommandations de pratique clinique. Voir gradeworkinggroup.org

2 Rappelons que, dans le cas emblématique du Mediator, la conviction a été définitivement emportée suite à une étude rigoureuse d’observation (enquête cas-témoin menée par la pneumologue Irène Frachon) et à un essai randomisé, le risque ayant ensuite été confirmé par une grande enquête de cohorte.

3 Une mission de service public ne signifie bien entendu pas qu’elle s’appuie sur les seuls experts fonctionnaires. La mission vise à servir l’intérêt général dans un cadre réglementé, mais l’expertise doit être choisie en fonction des meilleures compétences disponibles, industrielles et académiques, avec transparence sur les liens d’intérêts, qu’ils soient économiques ou idéologiques.