ОКО ПЛАНЕТЫ > Статьи о политике > Tut.by: Профессор из США изучил данные из протоколов комиссий в Беларуси и нашел статистические аномалии
Tut.by: Профессор из США изучил данные из протоколов комиссий в Беларуси и нашел статистические аномалии2-09-2020, 19:18. Разместил: Swarm |
Вадим Зипунников, профессор кафедры биостатистики американской школы общественного здравоохранения Джонса Хопкинса, проанализировал оцифрованные данные из фотокопий протоколов участковых избирательных комиссий, собираемые платформой «Зубр», и нашел статистические аномалии. Он прислал редакции TUT.BY свой статистический анализ — приводим его работу. Но вначале — кто такой Вадим ЗипунниковНа сайте Университета Джонса Хопкинса говорится, что Вадим — Associate Professor на кафедре биостатистики Школы общественного здравоохранения им. Блумберга при университете Джонса Хопкинса.
В частности, сейчас он занимается сбором данных, получаемых от носимых устройств, и сопоставляет эту информацию с более крупными базами данных, которые собираются традиционным способом, например при обследовании состояния здоровья. Так, профессор интересуется количественной оценкой: слабости и утомляемости в клинических группах населения с сердечными заболеваниями; физической инвалидности у людей с рассеянным склерозом; нарушений циркадных ритмов среди людей с биполярным расстройством, большим депрессивным расстройством и деменцией; качества сна у лиц с деменцией и болезнью Альцгеймера. Также Вадим вовлечен в анализ данных EMA (Ecological Momentary Assessment, сбор данных через приложения в смартфонах) — этот метод популярен в психологии для оценки когнитивных функций и эмоций (например, замера уровня печали, беспокойства, энергии и так далее). Почему специалиста из США заинтересовали выборы в Беларуси? — Я родился в России, но моя жена и дети граждане Республики Беларусь: жена родилась в Беларуси, потом переехала в США. Дети родились в США (поэтому граждане США по рождению), но получили гражданство Беларуси, так как мама гражданка РБ, — поясняет Вадим. Что за статистический анализ данных из протоколовВ сопроводительном письме Вадим Зипунников написал, что использовал для анализа оцифрованные данные из фотокопий протоколов, собираемые платформой «Зубр».
На данный момент база (она доступна по ссылке) включает 878 участков и 1 278 587 голосов. Вот к каким выводам пришел специалист, проанализировав фотокопии протоколов: 1. Основная выявленная статистическая аномалия представлена большим количеством УИК c четырьмя одновременно наблюдаемыми и статистически маловероятными характеристиками:
2. Выявлен сильный статистический тренд: каждые 7% досрочно проголосовавших (от общего числа зарегистрированных) «забирали» у кандидата Тихановской приблизительно 8% от окончательного результата и «прибавляли» приблизительно 8% к окончательному результату кандидата Лукашенко. 3. После исключения из анализа аномальных УИК:
4. Для дальнейшей коррекции наблюдаемого статистического тренда необходимы дополнительные предположения. Любая коррекция наблюдаемого статистического тренда приведет к дальнейшему увеличению процентов голосов за кандидата Тихановскую и дальнейшему уменьшению процентов голосов за кандидата Лукашенко. Позже Вадим добавил, что практически все результаты с участков гораздо ниже, чем официальные данные от ЦИК для Александра Лукашенко (80,08%), и гораздо выше, чем официальные цифры от ЦИК для Светланы Тихановской (10,09%). В этих данных уже присутствуют аномалии, и пересчет голосов не решит этой проблемы. — Тренды сами по себе не аномальны, исходя из призывов от штаба Тихановской проголосовать в основной день. Но когда они присутствуют вместе со статистическими аномалиями и сверхвысокой предварительной явкой, они становятся сильно подозрительными, — говорит специалист. Основная статистическая аномалияНа графике ниже показана необычно высокая концентрация досрочно проголосовавших — в районе 25%-45% от общего числа зарегистрированных (с необычно высоким пиком в 35%). кстати, я тоже обновил свои результаты на основе выложенных данных голоса, основные выводы остаются примерно теми же самыми. я также нарисовал основные паттерны которые явно показывают явное рисование: — когда рисуют примерно один и тот же или очень похожий % на соседних УИКах — забавно, что самый популярный процент (пик гистограммы) за Лукашенка это ровно 66.6% — где то 25 участков из выборки. Также очень много вокруг его. Скорее всего хотели нарисовать 2/3 голосов. — за счет тихановской отдают необычно большой % или против всех или испорченные или остальным кандидатам.
На аномальных участках с необычно высокой предварительной явкой (25%-45% от общего числа зарегистрированных) одновременно наблюдалась необычно высокая концентрация очень похожих результатов с окончательным процентом: • за Тихановскую в интервале: 0%-20% • за Лукашенко в интервале: 55%-75% • за остальных кандидатов и против всех в интервале: 10%-30% Статистический трендНа графиках ниже видно, что приблизительно каждые 7% досрочно проголосовавших (от общего числа зарегистрированных) «забирали» у кандидата Светланы Тихановской 8% от окончательного результата и «прибавляли» 8% к окончательному результату кандидата Лукашенко. Процент голосов, отданных за остальных кандидатов и «против всех», начинает сильно увеличиваться на участках, где официальный процент досрочно проголосовавших (от общего числа зарегистрированных) выше 25%. Возможно, считает автор анализа, это связано с тем, что пять дней предварительного голосования использовались, чтобы «максимизировать» официальное количество досрочно проголосовавших и каким-то образом «сформировать» тренды в наблюдениях № 1 и № 2. Коррекция выборки через удаление аномальных УИКДалее в анализе автор отмечает, что «чтобы исключить влияние УИК из аномальной области, мы исключили УИК с процентом досрочно проголосовавших (от числа зарегистрированных) больше 25%». В результате получились следующие данные (представлены межквартильные интервалы):
«Данный анализ сделан 15 августа 2020 года и главным образом анализирует аномалии и тренды, связанные с процентом досрочно проголосовавших от числа зарегистрированных, — подытоживает автор. — Предыдущий анализ, сделанный 14 августа 2020 года, анализирует аномалии и тренды, связанные с процентом досрочно проголосовавших от числа проголосовавших, и имеет похожие основные выводы».
Дополнено.Спустя примерно две недели специалист обновил свои результаты на основе выложенных данных платформы «Голос». По его словам, основные выводы остались примерно теми же самыми. Кроме того, обнаружились странные паттерны вроде того, когда на соседних УИК наблюдались похожие проценты. Так, самый популярный процент (пик гистограммы) за Лукашенко был ровно 66,6% — это где-то 25 участков из выборки
Новости по теме Сотрудники Гродненского мясокомбината требуют отставки Лукашенко, Ермошиной и новых выборов Больше 1100 работников БелЖД обратились к властям: просят отставку Лукашенко и новые выборы «Пережили практически все». Как прошла линейка в школе, откуда выплыли скандальные записи с выборов
Вернуться назад |