Voici le troisième livre que je lis en peu de temps sur les statistiques et c’est probablement le plus étrange. Après mon cher Taleb et son Cygne Noir, après les statistiques plus classiques avec Naked Statistics, voici l’histoire de la statistique bayésienne.
Si vous ne connaissez pas Bayes, permettez-moi simplement de mentionner sa formule, belle par sa symétrie: [Selon wikipedia]
En théorie des probabilités, le théorème de Bayes énonce des probabilités conditionnelles : étant donné deux évènements A et B, le théorème de Bayes permet de déterminer la probabilité de A sachant B, si l’on connaît les probabilités de A, de B et de B sachant A.
P (A | B) P (B) = P (B | A) P (A)
Je n’ai jamais été vraiment à l’aise avec ses applications. J’avais sans doute tort encore une fois, étant donné tout ce que j’ai appris après la lecture de livre de Sharon Bertsch McGrayne. Mais j’ai aussi compris pourquoi je n’ai jamais été à l’aise: depuis trois siècles, il y a eu une guerre quasi-religieuse entre bayésiens et fréquentistes sur l’utilisation des probabilités. Sont-elles liées aux événements fréquents seulement ou peuvent-elles être appliquées à des événements rares? Quelle est la probabilité d’un événement rare qui peut ne jamais se produire ou peut-être juste une fois?
[Laissez-moi vous donner un exemple personnel: Je suis intéressé par l’entrepreneuriat en série, et j’ai fait et je fais encore des tonnes de statistiques sur les entreprises liées à Stanford. J’ai plus de 5’000 entrepreneurs, et plus de 1’000 sont en série. J’ai des résultats qui montrent que les entrepreneurs en série ne sont pas en moyenne meilleurs que les autres, en utilisant les méthodes classiques des statistiques. Mais maintenant, je dois penser à utiliser:
P (Réussite | Série) = P (Série | Réussite) P (Réussite) / P (Série)
Je ne sais pas ce qui va en ressortir, mais je devrais essayer!].
Si vous voulez un bon résumé de l’ouvrage, lisez la critique de Andrew I. Daleby (pdf). McGrayne illustre l’histoire «récente» des statistiques et des probabilités par des scientifiques de renom (Laplace) et moins célèbres (Bayes), à travers de histoires célèbres (la machine Enigma et Alan Turing) et moins célèbres (des bombes atomiques perdues dans la nature) et c’est un livre fascinant. Je ne suis pas convaincu qu’il soit bon à expliquer la science, mais la quantité d’anecdotes est impressionnante. Et peut-être qu’il n’est pas question de science en définitive, mais plus de croyance comme cela est mentionné dans le livre: « Swinburne inséra des opinions personnelles à la fois dans les probabilités a priori et dans les données prétendument objectives du théorème de Bayes pour conclure que Dieu avait plus de 50% de chance d’exister; plus tard Swinburne calcula la probabilité de la résurrection de Jésus « à quelque chose comme 97 pour cent » [page 177]. Cela évidemment me rappelle la fameuse citation d’Einstein: « Dieu ne joue pas aux dés avec l’univers. » Ce n’est pas directement lié mais encore une fois, je lisais quelque chose sur les liens entre la science, la religion et les probabilités.