Статистические трюки, которые сбивают нас с толку
Если вы не хотите быть обманутыми разрекламированными исследованиями, придётся разобраться в кое-каких статистических трюках, которые могут сбить вас с толку
«Некоторые исследования показывают, что сексуальность человека можно определить по длине пальцев». Такой заголовок появился недавно в ведущем научном издании в области сексуальности «Архивы сексуального поведения». Основан такой вывод на исследовании, рецензированном уважаемыми учёными в Университете Эссекса. Лично мне кажется, что это куча чепухи и не более чем статистические трюки.
Просто, когда начинает казаться, что читатели новостей могут опомниться и начать интересоваться, проводилось ли рецензирование исследования, была ли выборка достаточно широкой или кто финансировал эту работу, на помощь приходит главный козырь. В этом случае обман принимает форму доверительных интервалов — статистическое понятие, в котором непрофессионал никогда не разберётся, чтобы действительно правильно понять новостную статью.
Но, если вы не хотите быть обманутыми разрекламированными и бесполезными исследованиями, придётся всё-таки разобраться в нескольких статистических принципах, которые могут сбить вас с толку, даже когда проставлены все галочки «законного исследования».
Чем я рискую изначально?
Один из самых удручающих заголовков, которые я когда-либо читала, звучал так: «Восьмилетнее исследование показало, что любители картошки фри удваивают риск своей смерти». «Уф, — сказала я вслух, потягивая красное вино и глядя на стоящую передо мной большую корзинку старой доброй золотистой картошечки фри. – Правда, что ли?»
Ну да, согласно рецензированному исследованию, опубликованному в «Американском журнале клинического питания», это правда. Употребление картошки фри действительно удваивает риск смерти. Но, как много для этого надо съесть? И какой изначально у меня риск смерти?
В исследовании утверждается, что, если вы едите картошку фри трижды в неделю или чаще, то удваиваете свой риск смерти. Рассмотрим обыкновенного человека в рамках этого исследования: например, 60-летнего мужчину. Какой у него риск смерти, независимо от того, сколько картошки фри он ест? Один процент. Это значит, что если взять 100 60-летних мужчин, то хотя бы один из них умрёт в течение следующего года просто потому, что ему уже 60 лет.
Итак, если все эти 100 мужчин едят картошку фри не менее трёх раз в неделю всю свою жизнь, то да, их риск смерти удваивается. Но удвоенный один процент – это всего лишь два процента. Вместо одного из них, за год умрёт два. И они едят картошку фри трижды в неделю всю жизнь – звучит, как очень привлекательный риск.
Такая статистическая концепция называется относительный риск. Если шанс получить какое-то заболевание – один из миллиарда, то даже если вы его учетверите, это будет всего лишь четыре из миллиарда. Скорее всего, этого не произойдёт.
Поэтому, в следующий раз, когда вы увидите увеличение или уменьшение риска, первый вопрос, который вы должны задать – увеличение или уменьшение от какого изначального риска?
Кроме того, могли ли эти люди, как и я, наслаждаться бокалом вина или пинтой пива вместе с картошкой фри? Могло ли что-то ещё повлиять на результат?
Есть сыр перед сном значит умереть, запутавшись в простынях?
В некоторых странах детская коробка стала модным подарком от государства новоиспечённым родителям. Такой подарок призван обеспечить новорожденных безопасным местом для сна. Инициатива пошла от финнов, в конце 30-х годов ХХ века они предпринимали большие усилия для снижения детской смертности во сне. В картонной коробке помещались вещи первой необходимости: несколько пелёнок, детские салфетки, боди, слюнявчики и прочее.
С появлением детской коробки уровень детской смертности в Финляндии резко снизился, сейчас в стране один из самых низких уровней детской смертности в мире. Этот факт заставляет думать, что именно детские коробки стали причиной снижения уровня детской смертности.
Но угадайте, что ещё изменилось? Ведение беременности. Чтобы получить право на детскую коробку, женщина должна была регулярно наблюдаться в медицинских учреждениях с первых четырёх месяцев беременности.
В 1944 году 31% финских матерей получали дородовое воспитание. В 1945 году этот показатель взлетел до 86%. Не детская коробка была причиной изменения уровня детской смертности, а дородовое воспитание и контроль здоровья.
Это классический случай, когда корреляция не то же самое, что причинная связь. Введение детских коробок и снижение уровня детской смертности связаны, но одно не вытекает напрямую из другого.
Однако этот небольшой факт не помешал производителям детских коробок продавать направо и налево «Оригинальные детские коробки прямо из Финляндии» за 449 долларов и 99 центов. А, между тем, США выделяют средства из бюджета на такие коробки для новых матерей.
Поэтому, в следующий раз, когда вы увидите взаимосвязь вроде того, что «употребление сыра перед сном грозит смертью в спутавшихся простынях», задайтесь вопросом: «А что ещё могло стать причиной?»
Когда погрешность больше, чем эффект
Последние данные Бюро трудовой статистики в США показали, что уровень безработицы в стране снизился с 3,9% в августе до 3,7% в сентябре. При выяснении этих цифр, сотрудники бюро явно не опрашивали каждого жителя США о наличии у него работы. Они опросили небольшую выборку людей, а потом обобщили результаты.
Это значит, что официальный уровень безработицы в любой заданный момент – это всего лишь предположение. Эта «ошибка плюс-минус» определяется тем, что статистика называет доверительным интервалом.
На самом деле данные говорят, что число безработных в стране уменьшилось на 270 000, но с возможной погрешностью, с доверительным интервалом в 263 000. Проще озвучить одно число, например, 270 000. Но выборка всегда будет иметь погрешность, и правильнее воспринимать это число как диапазон. В таком случае, статистика утверждает, что количество безработных сократилось где-то в диапазоне от 7 000 до 533 000.
То же самое и с определением сексуальности по длине пальцев – возможная погрешность может просто свести на нет все результаты исследования.
Самый очевидный пример доверительных интервалов, запутывающих нас, — это опросы перед выборами. Делается выборка из населения, выясняется, за кого будут голосовать в этой выборке, и из этого делается вывод, как поведёт себя население в день выборов.
Поэтому, в следующий раз, когда вы увидите число, говорящее обо всём населении при отсутствии возможности опросить каждого отдельного человека или проверить каждый отдельный предмет, задайтесь вопросом о погрешности.
Гарантирует ли знание этих трёх статистических аспектов, что вас никогда не одурачат? Нет. Но это, без сомнения, вам пригодится.
Комментариев нет:
Отправить комментарий