Juste une coïncidence ?

Le cerveau humain semble programmé pour détecter des schémas. Cela présente sans doute des avantages évolutifs, mais cette caractéristique peut nous induire en erreur dans un monde surchargé de données. Je commencerai par une anecdote personnelle, puis j'en montrerai les implications pour l'analyse des données.
Le 18 juin, alors que je traversais l'ouest de Vancouver, j'ai remarqué une rue nommée « Trutch ». Je me souviens avoir trouvé ce nom étrange. Quelques jours plus tard, Tyler Cowen a publié un lien vers un article du journal de Vancouver annonçant que le nom de cette rue venait d'être changé :
Dan Fumano : De nombreux habitants de la rue, récemment connue sous le nom de Trutch, se sont déclarés favorables à un changement de nom. Ils s’inquiètent toutefois des conséquences pratiques possibles d’une rue dont le nom unique serait orthographié dans une langue autre que l’anglais.
Auteur de l'article : Par Dan Fumano Publié le 17 juin 2025, Dernière mise à jour le 18 juin 2025
C'est un nom encore plus étrange !
Notez que le changement de nom s'est produit juste au moment où j'ai observé la rue. Cela semble une coïncidence assez étonnante. Mais ce n'est pas tout. Lundi dernier, nous avons passé une nuit dans un hôtel à Calgary, avant de rentrer. Le lendemain matin, je me suis réveillé et j'ai jeté un œil à Marginal Revolution. Voici le premier article que j'ai vu :
Calgary reprend avec le fluorure et le fait du jour au QuébecC'est une coïncidence encore plus frappante. C'est presque comme si Tyler était au courant de mes projets de voyage et avait volontairement publié des informations en rapport avec ma localisation. Bien sûr, c'est absurde, il ne savait même pas que j'étais en vacances. Mais on comprend qu'une personne superstitieuse puisse trouver ces coïncidences significatives. Quelles sont les probabilités ?
Vous pensez peut-être que dans un monde où des milliards d'événements se produisent chaque jour, une coïncidence n'a pas tant de sens que ça. Pourtant, une grande partie de nos recherches en sciences et en sciences sociales reposent sur l'hypothèse que les coïncidences sont très significatives. En physique, du moins, les scientifiques insistent souvent sur des coïncidences très inhabituelles, les « événements 5 sigma », c'est-à-dire supérieures à 5 écarts types par rapport à la valeur prédite. Or, dans de nombreux domaines, il existe un test de significativité beaucoup plus faible, à seulement deux écarts types de l'hypothèse nulle. Cela signifie que les coïncidences aléatoires dont la probabilité de réussite est de seulement 20 contre 1 sont considérées comme hautement significatives.
Dans un récent article d'EconLog, Kevin Corcoran a déclaré :
En 2007, Eliezer Yudkowsky a écrit un article intéressant prônant ce qu'il appelait « défier les données ». L'idée était simple : imaginez que vous ayez une théorie expliquant le fonctionnement du monde. Une nouvelle étude est publiée avec des données qui ne peuvent être prises en compte dans votre cadre théorique. Comment réagir ?
Une réponse consiste à abandonner sa théorie au profit des nouvelles données. Une autre solution consiste à la conserver intacte et, comme le dit Yudkowsky, à « attaquer l'expérience – accuser les chercheurs de malhonnêteté, de conception défectueuse ou de conflit d'intérêts ». Mais il existe une troisième possibilité : celle de simplement défier les données.
Si une théorie a été bien établie et confirmée par de multiples études et expériences, alors une apparition vraiment frappante de données contraires ne devrait pas avoir beaucoup d’impact.
À première vue, cela peut paraître peu scientifique. Mais en pratique, les preuves « réfutant » une théorie donnée ne sont souvent qu'une banale coïncidence, un phénomène quotidien.
Même les experts les plus avisés (et moi-même) se laissent parfois tromper par des coïncidences. L'un des pires exemples récents concerne le débat sur l'origine de la Covid. Tout au long de l'histoire, les pandémies ont souvent débuté dans les grandes villes du sud de la Chine, où d'importantes populations vivent à proximité de marchés d'animaux sauvages. C'est ainsi que la première épidémie de SRAS a débuté en novembre 2002. La pandémie de Covid (SRAS-2) semble avoir débuté de manière presque identique, sur un marché d'animaux sauvages de l'une des plus grandes villes du sud de la Chine.
Malgré cela, de nombreux experts ont adopté la théorie totalement infondée selon laquelle le Covid serait issu d'une fuite de laboratoire, car parmi la demi-douzaine de plus grandes agglomérations du sud de la Chine, il est apparu pour la première fois dans une agglomération dotée d'un important institut de recherche sur les virus. C'est l'une des coïncidences les plus faibles que j'aie jamais observées, et pourtant, beaucoup semblent la considérer comme un solide argument en faveur de la théorie de la fuite de laboratoire. En revanche, l'hypothèse du marché aux animaux repose sur une coïncidence dont la probabilité de survenue aléatoire est bien plus faible.
Il y a des millions de rues dans le monde. Le fait que j'aie remarqué une rue à Vancouver juste avant que Tyler publie un article à son sujet est une coïncidence assez étonnante. Et que l'article de Tyler sur le fluorure soit paru dix jours plus tard, alors que je passais par Calgary, est une coïncidence encore plus étonnante. En revanche, toute la théorie de la fuite du laboratoire ne repose sur rien d'autre qu'une coïncidence aussi insignifiante que de lancer le même chiffre deux fois de suite au dé à six faces.
econlib