Le pendule de Foucault

Dygest Original

La terre tourne, preuve à l'oeil nu

Écouter l'extrait du podcast :

0:00 --:--

Description

Un test médical est positif. Il est fiable à 99 %. La maladie qu’il dépiste touche une personne sur dix mille. Quelle est la probabilité d’être effectivement malade ? La réponse spontanée — 99 %, puisque le test est fiable à 99 % — est fausse. La bonne réponse tourne autour de 1 %. Ce décalage entre ce que notre intuition calcule et ce qu’il faudrait calculer a un nom, un auteur, et une histoire longue de deux siècles et demi. L’auteur est un pasteur presbytérien du XVIIIᵉ siècle qui a publié son théorème après sa mort. L’histoire est celle d’une formule longtemps méprisée devenue la colonne vertébrale de la plupart des systèmes qui apprennent — des filtres anti-spam aux moteurs de traduction, des diagnostics médicaux aux voitures autonomes.

La question que l’on se pose : pourquoi une formule publiée en 1763 par un pasteur amateur est-elle restée marginale pendant deux siècles avant de devenir la mathématique dominante d’une ère entière ?

Ce que l’on va voir : la formule elle-même et ce qu’elle calcule ; son long purgatoire face à l’école fréquentiste ; sa réhabilitation opérationnelle pendant la Seconde Guerre ; etl’explosion contemporaine qui fait de Bayes l’inconscient mathématique du monde numérique.

Sommaire

Une formule pour réviser son avis

Thomas Bayes est un pasteur anglais mort en 1761 sans avoir publié son théorème. C’est son ami Richard Price qui retrouve le manuscrit, l’édite et le présente à la Royal Society en 1763. Le texte s’intitule Essay towards solving a problem in the doctrine of chances. Son ambition est modeste : étant donné ce qu’on a observé, comment mettre à jour ce qu’oncroyait ?

La formule dit ceci. On a une croyance initiale sur une hypothèse — par exemple, ce patient a une probabilité de 1 sur 10 000 d’avoir la maladie M, parce qu’on connaît la prévalence. On observe une donnée nouvelle — son test est positif. La formule calcule la probabilité révisée d’avoir la maladie sachant ce nouveau résultat, en pondérant trois termes : la croyance initiale (ici très basse), la probabilité de voir ce résultat si l’hypothèse est vraie (99 %, sensibilité du test), et la probabilité de voir ce résultat en général (dominée par les faux positifs quand la maladie est rare). Le calcul complet donne une probabilité post-test d’environ 1 %. Autrement dit : quand on dépiste une maladie rare avec un test moyen, la plupart des positifs sont des faux positifs. C’est contre-intuitif, c’est statistiquement trivial, et ça explique pourquoi les programmes de dépistage systématique font débat.

Téléchargez Dygest

pour avoir une expérience complète !

Télécharger dans l'App Store Disponible sur Google Play

Deux siècles de purgatoire

Le XIXᵉ et la première moitié du XXᵉ voient s’imposer une autre école, dite fréquentiste, incarnée par Ronald Fisher, Jerzy Neyman et Egon Pearson. Pour eux, une probabilité n’a de sens que si elle mesure la fréquence d’un événement dans une série. Lancer une pièce dix mille fois et observer qu’elle tombe sur pile dans 50,1 % des cas — ça, c’est uneprobabilité. Parler du degré de croyance qu’on accorde à une hypothèse est considéré comme non scientifique, contaminé par le subjectif. Les tests statistiques classiques — p-value, intervalle de confiance, hypothèse nulle — sont tous fréquentistes. Bayes devient une curiosité qu’on mentionne dans les introductions et qu’on ne pratique pas.

Téléchargez Dygest

pour avoir une expérience complète !

Télécharger dans l'App Store Disponible sur Google Play

Bletchley Park, la machine de Turing et la bombe

Ce qui sauve Bayes de l’oubli académique, c’est une guerre. À Bletchley Park, pendant la Seconde Guerre mondiale, Alan Turing attaque la machine Enigma des Allemands. Le problème : tester toutes les configurations possibles est impossible, même avec les machines électromécaniques de l’époque. La méthode que Turing met au point, formalisée ensuite par son collègue I. J. Good, consiste à calculer pour chaque nouvelle lettreinterceptée comment elle modifie la probabilité que telle ou telle configuration de rotors soit la bonne. C’est du Bayes pur, industrialisé dans la bombe — la machine qu’ils conçoivent pour automatiser le calcul. L’historien David Kahn a établi que cette méthode a permis de décrypter Enigma en quelques heures au lieu de plusieurs semaines. Le résultat est classifié pendant trente ans. Quand il sort, le prestige opérationnel qui s’attache à la méthode de Turing contamine la théorie elle-même.

Téléchargez Dygest

pour avoir une expérience complète !

Télécharger dans l'App Store Disponible sur Google Play

L’inconscient mathématique du numérique

L’explosion arrive avec la puissance de calcul. À partir des années 90, les ordinateurs deviennent assez puissants pour exécuter des calculs bayésiens sur des millions d’hypothèses simultanément — ce qui restait théorique devient praticable. Le premier succès grand public est le filtre anti-spam. Paul Graham, en 2002, publie un article qui décrit comment un filtre bayésien apprend à distinguer le spam du courrier normal en révisant continuellement la probabilité associée à chaque mot. Le filtre s’entraîne en regardant ce que l’utilisateur marque comme spam, met à jour ses probabilités, et en quelques semaines atteint une précision que les filtres à règles n’ont jamais approchée. Le paradigme se diffuse immédiatement.

Aujourd’hui Bayes est partout. Les voitures autonomes fusionnent des données de caméras, de lidar et de radar en pondérant la confiance qu’elles accordent à chacun — formalisme bayésien. La reconnaissance vocale calcule la phrase la plus probable étant donné le signal sonore — bayésien. Les moteurs de recommandation révisent leurs prédictions au fil des clics — bayésien. Les diagnostics médicaux assistés, les modèles climatiques, les tests A/B des plateformes web : tous reposent sur la même architecture de croyance révisée. Le statisticien Nate Silver, dans The Signal and the Noise, en fait le principe de méthode de ses prévisions électorales. L’intelligence artificielle contemporaine elle-même, sous son vernis de réseaux de neurones, est largement compréhensible comme de l’inférence bayésienne à très grande échelle. L’école qui avait passé deux siècles dans l’ombre s’est imposée dans le seul domaine que le XXᵉ siècle n’avait pas anticipé : celui des machinesqui apprennent.

Téléchargez Dygest

pour avoir une expérience complète !

Télécharger dans l'App Store Disponible sur Google Play

Conclusion

Ce que l’histoire de Bayes raconte, c’est la manière dont un outil mathématique peut rester marginal pendant des générations jusqu’à ce qu’un environnement technique le rende indispensable. La formule n’a pas changé depuis 1763. Ce qui a changé, c’est la nature des problèmes qu’on cherche à résoudre.