четверг, 9 апреля 2020 г.

Проблема измерения и измерение как проблема: социальное дистанцирование работает

Проблема измерения и измерение как проблема: социальное дистанцирование работает

Статья является вольным авторским переводом публикации «How Reliable Are the Coronavirus Numbers?» с заимствованиями из статьи; в этих источниках можно найти ссылки на использованные материалы.
Photo copyright: Laura Guerrero/Ajuntament de Bcn.. CC BY-ND 2.0
Объем информации о коронавирусе во всем мире огромен – невозможно включить телевизор ни на одном канале и ничего не слышать о нем в течение трех минут. Анекдоты, слухи и действительно важные новости смешиваются до точки неразличения; на смену паникерам приходят миротворцы, пессимистов – оптимисты, политикам – эксперты и блогеры и так далее. Даже если игнорировать первый слой информации – средства массовой информации – и переключиться на более надежный источник – научные исследования, впечатление от какофонии кардинально не изменится. Десятки моделей уже разработаны разными специалистами и прогнозы варьируются в чрезвычайно широком диапазоне.
Но какими бы ни были модели, они должны основываться на чем-то что измеряется с определенным уровнем точности. Наука начинается, когда что-то измеряется, и заканчивается, когда это не так (за исключением математики, которая не заботится об этом тривиальном факте). Что можно сказать об измерении в такой необычной ситуации, в которой сейчас находится мир? Вот некоторые часто повторяемые критические комментарии о различных индикаторах, вовлеченных в процесс.
1. Реальное количество людей с вирусом значительно выше, чем сообщалось (по мнению некоторых авторов, в 10 раз), потому что у многих людей есть вирус, но они не были протестированы (легко переболели, не заметив этого).
2. Количество доступных тестовых наборов со временем растет, и в результате увеличивается число обнаруженных случаев, что делает данные несопоставимыми по динамике.
3. Качество теста (его способность улавливать меньшую или более высокую концентрацию вирусов в организме) отличается от страны к стране или даже от штата к штату; это также изменяется во времени, что добавляет беспорядок в проблему сопоставимости.
4. Доступность тестов сильно различается в разных регионах, странах и штатах, что делает любые сравнения еще сложнее.
5. Зарегистрированные случаи смерти считаются более надежным показателем, чем число случаев, но большое подозрение вызывает то, что слишком много случаев связано с вирусом без надлежащего основания. Если, скажем, у человека вирус, но он имел также другие осложнения (иногда смертельные), смерть, скорее всего, будет кодифицирован как смерть от вируса. Число погибших, имеющих только коронавирус и ничего больше (в группе пожилых людей), согласно одному исследованию, составляет всего 12% от общего числа смертей.
6. Сознательное искажение информации (как правило, в стороны занижения) по политическим или просто бюрократическим причинам – сейчас активно обсуждается сокрытие своевременных данных китайцами; подозрения вызывают цифры из России и т.д.
Все эти и другие проблемы являются действительными и позволяют сказать, что, скорее всего, реальная смертность (количество умерших из-за вируса, разделенное на всех тех, у кого был вирус) серьезно ниже, чем часто рапортуемый уровень 1–5%. Это означает, соответственно, что текущие крайние меры могут быть чрезмерной реакцией на происходящее. Если это так, то весь кризис является побочным продуктом грубых искажений и сознательной манипуляцией данными. Но это слишком серьезное утверждение, которое невозможно доказать.
Функция любых измеряемых показателей в обществе состоит в том, чтобы предоставлять некоторые ориентиры для принятия решений. Это работает именно так, независимо от близости измерителя к измеряемому. Лица, принимающие решения, используют те данные, какие есть – и это как-то работает. Индекс Доу-Джонса имеет очень малый смысл со статистической точки зрения – он определяется как взвешенная средняя цена акций, которая не зависит от объёма капитализации, т.е. компании, отличающиеся в десятки раз по размеру, считаются равными. Никто не знает, насколько верны цифры телевизионной аудитории, поставляемые монополистом на этом рынке Нильсеном – но люди платят на их основе миллиарды долларов. Оценки экономики и власти Советского Союза в период холодной войны были в корне неверными (по иронии судьбы, в двух противоположных направлениях – недооценка его милитаризации и переоценка его политической стабильности) – и все же успешно работали в целях его сдерживания. Восприятие реальности, а не фактическое измерение, движет миром. И если фактическое измерение – очень сложное упражнение, то что сказать о восприятии? Лишь то, что его еще гораздо сложнее измерить.
Под этим углом, скорее всего, нынешняя феерия и будет рассматриваться будущими аналитиками: то ли как еще один пузырь, типа первого экономического “тюльпанового” кризиса в Голландии в 17-м веке – если жуткие опасения не подтвердятся; то ли как новое грандиозное испытание для человечества (оно, собственно, уже имеет место) – если кризис разрастется. В любом случае меры будут приняты, и в течение следующих десяти лет наши генералы станут, как обычно, готовится к последней прошедшей войне, то бишь к приходу подобного вируса. Но случится, конечно, нечто совсем другое.
Можем ли мы извлечь из всего этого что-то полезное, даже зная, что измерения, скорее всего, далеки от реальности? Кажется, да. Количество случаев и смертей растет, но где-то «кривая начала сглаживаться». Что-то действительно улучшается? Кажется – да.
На рис. 1 показаны изменения такого важного показателя, как “среднее количество людей, зараженных одним больным человеком” – так называемое reproduction number, R0, одна из важнейших характеристик любой эпидемии или пандемии. Он был рассчитан на основе двух идей.
Рис 1. Оценка среднего числа заражений одним больным человеком (здесь и ниже 3 штата включают Нью-Йорк, Нью-Джерси и Коннектикут; источник данных – Университет Джона Хопкинса)
Главное в том, что значения Р0 во второй половине марта находятся ниже уровня 1, что означает, что интенсивная фаза распространения вирусов прошла (в основном, из-за социального дистанцирования). Другими словами, мы вошли в зону сокращения. Ежедневное увеличение числа случаев продолжается, но в процентном отношении оно резко уменьшается (см. рис. 2), что также противоречит концепции «экспоненциального роста», наряду с R0 <1. Это означает, что процесс распространения вируса скоро будет «сглажен».
Игорь Мандель
igor.mandel@gmail.com
4/8/2020

Комментариев нет:

Отправить комментарий

Красильщиков Аркадий - сын Льва. Родился в Ленинграде. 18 декабря 1945 г. За годы трудовой деятельности перевел на стружку центнеры железа,километры кинопленки, тонну бумаги, иссушил море чернил, убил четыре компьютера и продолжает заниматься этой разрушительной деятельностью.
Плюсы: построил три дома (один в Израиле), родил двоих детей, посадил целую рощу, собрал 597 кг.грибов и увидел четырех внучек..