Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
техническое: промежуточная явка по участка Москвы
barouh
Энтузиасты добрались до анализа данных по промежуточной явке 4 декабря - участковые комиссии обязаны отчитываться по явке по состоянию на 10, 12, 15 и 18 часов, и эти данные публикуются на сайтах ГАС Выборы. Я тоже поучаствовал, и некоторые промежуточные результаты изложены ниже. Не шибко интересующимся темой можно не читать. Громких сенсаций здесь нет

Вот тут уoude_rus получилось, что в Москве было две группы участков ("суб-ансамбля"), и в каждый временной отрезок после 10 часов участки из второй группы голосовали активнее, чем участки из первой группы, т.е. в течение дня разница по накопленной явке между двумя группами участков устойчиво росла

И автор, и я полагаем, что в Москве участки с высокой явкой (т.е. второй "суб-ансамбль") - это, в большинстве своем, участки, на которых результаты голосования фальсифицировались в пользу ЕР. Но при этом лично мне механизм заблаговременного "размазывания" по времени приписанной явки непонятен

По приведенной выше ссылке оживленное обсуждение, за полторы сотни комментов

А я посмотрел на те же данные (со своим стандартным фильтром - учитывал участки не менее  чем с 1000 избирателей) с другой стороны - я посмотрел на соотношение явки в разные периоды времени и наличие корреляций между ними. При этом, в отличиек от oude_rus, я смотрел не на накопленную явку, а на изменения явки между разными контрольными отсечками

И у меня получились иные результаты (графики ниже):
- я не вижу, чтобы московские участки распадались бы на две четкие группы. Я вижу одно достаточно "хаотичное" облако
- если бы действительно было две группы участков - на протяжении всего дня голосующих более и менее активно - то мы бы увидели положительную корреляцию между явками в разные периоды дня голосования. Но графики показывают слабую отрицательную корреляцию, а между интервалами 12-15 часов и 15-18 часов отрицательная корреляция вполне заметная
- для участков с большой явкой по итогам дня и с маленькой явкой по итогам дня прослеживаются разные закономерности по соотношению явки в разные интервалы времени
- в целом участки с небольшой явкой (до 53% - т.е. участки, по которым нет оснований предполагать наличие вбросов) показывают меньший разброс, на каждом из графиков большинство из них образует компактное "облако". Большинство же "отклонений", менее плотно заполняющих остальное пространство графика, - это участки с явкой более 53% и как правило более 60%

Пока не знаю, какие из этого выводы. Надо разбираться дальше (что требует времени, которого нет)


(на приведенных ниже графиках каждая точка - это один участок; проценты по осям - это процент от всех избирателей на участке; явка за определенный интервал может быть меньше 0 - сообщаемые УИКами цифры не проверялись при вводе в ГАС Выборы, и там могут быть опечатки, плюс при изменении оценок по явке в меньшую сторону данные по явке за предыдущие контрольные осечки не корректировались; для каждого графика исключено по 0,5% участков с наибольшими значениями по X и по Y и исключены участки с "отрицательной явкой" свыше -10%)

явка 10-12ч (Y) относительно явки 8-10ч (X)
Москва УИКи явка 8-10ч и 10-12ч

явка 12-15ч (Y) относительно явки 10-12ч (X)
Москва УИКи явка 10-12 и 12-15ч

явка 15-18ч (Y) относительно явки 12-15ч (X)
Москва УИКи явка 12-15ч и 15-18ч

явка 18-20ч (Y) относительно явки 15-18ч (X)
Москва УИКи явка 15-18ч и 18-20ч



  • 1
Спасибо.
При этом на каждой диаграмме есть плотное центральное облако и вокруг него широкое рассеяннное. Интересно было бы выделить участки с низким и, наоборот, с очень высоким процентом за ЕР - может, тогда стало бы чуть понятнее?

я сделал такие графики, но вывешивать их тут не хочу - слишком муторно оформлять и комментировать. Там с ходу мало что понятно

Могу выслать файл (xls) или выложить графики одним файлом куда-нибудь

я это делал. ничего не видно.
я ж говорю, что я все переделал с нулевым результатом.

я не совсем понял, что именно нарисовано: зависимость явки в 18 (например) часов от явки на 15 часов, или приращения явки в интервале 18-15 часов к приращению явки в интервале 15-12 часов?

второе - приращение явки aka дельта

тогда это просто показывает скорость роста явки: вначале дня она возрастает (вторая производная положительная), потом - убывает (отрицательная).

ну все же в первую очередь эти графики показывают, что участки отличаются друг от друга не столько постоянно более высокой или более низкой явкой (постоянно = в каждом из 5 временных интервалов), сколько временем, в которое наблюдается повышенная (относительно среднего в данный временной интервал) явка

ну и второй вывод - что есть большая группа участков со стандартной для данного временного интервала явкой, и есть для каждого интервала многочисленные отклонения (участки с явкой сильно большей или сильно меньшей "нормальной" для данного интервала), но при этом списки отклоняющихся участков для разных временных интервалов пересекаются слабо

то есть вы перешли на поиски флуктуаций. на этом пути я ничего не нашел, но, может, смотрел плохо.

по хорошему, надо просто посчитать временнУю корреляционную функцию для каждого участка, а потом их сравнить. Где есть флуктуации - там корреляционная функция затухнет очень быстро, где нет - останется на высоком уровне. Самое смешное, что восстановление корреляционных функций по экспериментальным данным - это моя, типа, работа (одна из). То есть я знаю, что надо делать в принципе, но строить корреляционную функцию по 5 неэквидистантным временнЫм точкам я не знаю как!

про затухание корреляционной функции я уже ничего не понимаю, честно признаюсь

  • 1
?

Log in

No account? Create an account