Le prestigieux Prix Rousseeuw de statistiques (du nom du statisticien Peter J. Rousseeuw de la KUL), décerné par un jury international et indépendant nommé par la Fondation Roi Baudouin, revient cette année à une équipe de l'Université de Tel Aviv - Yoav Benjamini, Daniel Yekutieli et Ruth Heller (photo) -, qui s'est penchée sur la problématique du " false discovery rate " (FDR) et les solutions pour mieux le contrôler.

Ce prix biennal est doté d'un million de dollars. Il couronne une recherche statistique exceptionnelle, qui a un impact profond sur la société. C'est le cas du travail récompensé cette année puisque, comme le souligne la Fondation Roi Baudouin, il propose " des méthodes pour limiter le nombre de fausses découvertes, sans étouffer le potentiel de vraies découvertes ".
Qu'est-ce que le FDR?
On doit le concept originel de " FDR " à un autre chercheur, Yosef Hochberg, qui a ouvert la voie dès 1995, mais qui est décédé depuis. Avec Benjamini, déjà, il avait publié une première étude permettant une formulation mathématique du FDR, connue des scientifiques comme la méthode " Benjamini-Hochberg ". L'étude, aujourd'hui citée près de 110.000 fois, était tellement révolutionnaire à l'époque qu'il lui fallut cinq années avant d'être enfin acceptée par une revue, en l'occurrence le Journal of the Royal Statistical Society.
Concrètement, il vous est sûrement déjà arrivé de lire une étude sur une nouvelle découverte médicale... et de ne plus jamais en entendre parler par la suite. Pourquoi ? Eh bien parce qu'elle n'a jamais pu être réitérée. C'est ce qu'on appelle "la crise de la reproductibilité". Elle est notamment liée au fait de se baser sur un très grand nombre de résultats potentiels, qui confère plus de risques de faire de fausses découvertes, et donc de publier des affirmations en réalité peu fiables. " Par exemple, lorsqu'on recherche un marqueur génétique ", illustre la Fondation Roi Baudouin, " on examine souvent plus de 20.000 gènes ". Or un lien apparent peut être simplement dû au hasard.
Mais d'un autre côté, si on se limite, on ne fait quasi plus de découvertes... Comment contourner cet écueil ? La procédure Benjamini-Hochberg (BH) se base sur le rapport entre le nombre de fausses découvertes et le nombre total de découvertes, le " FRD " ainsi obtenu devant demeurer sous un seuil défini. Mais comment le définir ? En ajustant les p-valeurs en fonction du nombre d'hypothèses testées, sa valeur dépend donc des données elles-mêmes.
Les recherches sur le FDR se sont poursuivies pour améliorer l'estimation de la reproductibilité des résultats scientifiques. De son côté, l'informatique a révolutionné la recherche scientifique en permettant de traiter énormément de data. Les chercheurs en génomique, en protéomique, en neurosciences, mais aussi les statisticiens issus d'autres secteurs comme l'économie et l'agriculture ont désormais recours à ce concept. " L'importance de la recherche sur le FDR augmente avec la complexité des questions scientifiques posées ", constate la Fondation Roi Baudouin, qui n'a pas encore donné de date pour la remise du prix aux lauréats.
C.V.
Risque-t-on d'être piqué par une méduse en mangeant une glace?
En 2022, la première édition du Prix Rousseeuw avait récompensé un travail déjà novateur, dédié à " l'inférence causale en médecine et en santé publique ", réalisé par James Robins et Miguel Hernán (Harvard), aidés de Thomas Richardson (Washington), Andrea Rotnitzky (Argentine) et Eric Tchetgen Tchetgen (Pennsylvanie).
Qu'est-ce que " l'inférence causale " ? Derrière ce terme a priori alambiqué se cache tout simplement le fait de déterminer d'une part les causes et, de l'autre, les effets. Sauf que ça peut s'avérer bien plus compliqué qu'il n'y paraît, surtout quand différents facteurs se conjuguent.
Été oblige, prenons l'exemple du nombre de piqûres de méduses sur un jour à la mer. Ce nombre a tendance à évoluer parallèlement à celui des ventes de... glaces. C'est ce qu'on appelle une corrélation : les jours où l'on consomme plus de crèmes glacées, il y a aussi davantage de piqûres de méduses. Ce nombre de piqûres est également en lien avec la température ambiante et le nombre de baigneurs. Pourtant, tous ces facteurs ne sont pas à l'origine des piqûres : manger une glace ne provoque pas de piqûre, contrairement à nager dans la mer...