Просто совпадение?

Человеческий мозг, похоже, запрограммирован на то, чтобы замечать закономерности. Это, вероятно, имеет некоторые эволюционные преимущества, но это свойство может сбить нас с толку в мире, перегруженном данными. Начну с личного случая, а затем покажу, как это влияет на анализ данных.
18 июня я проезжал по западной части Ванкувера и заметил улицу с названием «Тратч». Помню, мне показалось, что это странное название. Всего несколько дней спустя Тайлер Коуэн дал ссылку на статью в ванкуверской газете , где обсуждалось, что название этой улицы только что сменилось:
Дэн Фумано: Многие жители улицы, которая совсем недавно называлась Тратч, заявили, что поддерживают изменение названия. Но их беспокоят возможные практические последствия того, что единственное название улицы будет написано не на английском языке.
Автор статьи: Дэн Фумано. Опубликовано 17 июня 2025 г., последнее обновление 18 июня 2025 г.
Это еще более странное название!
Обратите внимание, что название сменилось примерно в то же время, когда я заметил эту улицу. Это кажется довольно удивительным совпадением. Но это ещё не всё. В прошлый понедельник мы остановились на ночь в отеле в Калгари перед вылетом домой. На следующее утро я проснулся и заглянул в Marginal Revolution. Вот первый пост, который я увидел:
Калгари возобновляет использование фтора, а Квебек – факт дняЭто ещё большее совпадение. Как будто Тайлер знал о моих планах на поездку и намеренно опубликовал материалы, связанные с моим местоположением. Конечно, это чушь, он даже не знал, что я в отпуске. Но вы понимаете, как суеверный человек может находить совпадения многозначительными. Каковы шансы?
Возможно, вы думаете, что в мире, где каждый день происходят миллиарды событий, совпадения не так уж и многозначительны. Но многие наши исследования в области естественных и социальных наук основаны на предположении, что совпадения имеют огромное значение. По крайней мере, в физике учёные часто настаивают на крайне необычных совпадениях, «событиях с отклонением в 5 сигм», что означает более 5 стандартных отклонений от прогнозируемого значения. Но во многих областях существует гораздо более слабый критерий значимости — всего два стандартных отклонения от нулевой гипотезы. Это означает, что случайные совпадения с вероятностью всего 20 к 1 считаются весьма значимыми.
В недавней публикации в EconLog Кевин Коркоран сказал следующее:
В 2007 году Элиезер Юдковски написал интересную статью, пропагандируя то, что он назвал « броском вызов данным». Идея была довольно простой: предположим, у вас есть некая теория, объясняющая устройство мира. Публикуется новое исследование с данными, которые не укладываются в вашу теоретическую модель. Как на это реагировать?
Один из вариантов — отказаться от своей теории в пользу новых данных. Другой вариант — сохранить свою теорию нетронутой и, как говорит Юдковски, « нападать на эксперимент — обвинять исследователей в нечестности, несовершенстве плана или конфликте интересов». Но есть и третий вариант — просто игнорировать данные.
Если теория хорошо обоснована и подтверждена многочисленными исследованиями и экспериментами, то одно действительно разительное появление противоречащих ей данных не должно иметь большого значения.
На первый взгляд это может показаться ненаучным. Но на практике часто случается так, что доказательства, «опровергающие» ту или иную теорию, оказываются всего лишь обычным совпадением, которое случается каждый день.
Даже очень умные эксперты (и я сам) иногда попадаются на уловки совпадений. Один из худших недавних примеров – споры о происхождении COVID-19. На протяжении всей истории пандемии часто начинались в крупных городах на юге Китая, где большие группы населения проживали в непосредственной близости от рынков диких животных. Так началась первая эпидемия атипичной пневмонии (SARS) в ноябре 2002 года. Пандемия COVID-19 (SARS-2), похоже, началась практически аналогичным образом – на рынке диких животных в одном из крупнейших городов на юге Китая.
Несмотря на это, многие эксперты поддержали совершенно необоснованную теорию о том, что COVID-19 появился в результате утечки из лаборатории, поскольку из полудюжины крупнейших мегаполисов на юге Китая он впервые появился в одном, где находится крупный исследовательский институт по вирусологии. Это одно из самых слабых совпадений, которые я когда-либо видел, и тем не менее, многие, похоже, считают его убедительным подтверждением теории утечки из лаборатории. Напротив, гипотеза о рынке животных основана на совпадении, которое на много порядков менее вероятно, чтобы произойти случайно.
В мире миллионы улиц. Тот факт, что я заметил определённую улицу в Ванкувере прямо перед тем, как Тайлер опубликовал статью о ней, на самом деле является довольно удивительным совпадением. А то, что пост Тайлера о фториде появился всего через 10 дней, как раз когда я проезжал через Калгари, — ещё более удивительное совпадение. В отличие от этого, вся теория об утечке в лаборатории основана всего лишь на незначительном совпадении, которое примерно так же интересно, как выпадение одного и того же числа два раза подряд при подбрасывании шестигранного кубика.
econlib