Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
Володинские 62,2% в Саратове: математическое доказательство фальсификации для чайников
barouh

Последние дни много веселья про результаты выборов в Саратове, где более чем на четверти участков результат Единой России оказался ровно 62,2% с точностью плюс-минус несколько сотых процента. Вот тут наглядно. Особой пикантности придает тот факт, что в Думу от Саратовской области баллотировался Володин - зампред президентской администрации, куратор всех выборов и будущий спикер Госдумы

На уровне базовой вменяемости понятно, что не может быть такое совпадение результатов на десятках участков. Но люди просят ДОКАЗАТЕЛЬСТВ. Ну что же, объясняю на пальцах и с цифрами. Математическое доказательство того, что результаты выборов по Саратову фальсифицированы

Для начала представьте себе огромный контейнер, в котором много-много (больше 100 тысяч) шаров. Белые и черные. Черных больше - 62,2% от всех. Шары равномерно и добросовестно перемешаны - т.е. в любой части контейнера соотношение белых и черных шаров примерно одинаковое
Теперь мы вслепую достаем шары из этого контейнера и раскладываем по кучкам. Пусть в каждой кучке у нас будет 1340 шаров. Сколько в каждой кучке будет черных шаров? Можем ли мы быть уверены, что в каждой кучке доля черных шаров будет именно 62,2%, а не скажем 62,0%, 62,4% или 65,0%? Тут нам на помощь приходит математика биномиального распределения. Биномиальное распределение - это такое случайное распределение, у которого может быть только два значения (0 или 1, "да" или "нет") и у которого есть определенная вероятность, что случится исход "да". Вокруг этого построен большой и важный раздел теории вероятности, и здесь используется четкая и легко доказуемая математика
Прежде чем с помощью тервера отвечать на условно сложный вопрос про 1340 шаров, давайте посмотрим на простую ситуацию - вытаскиваем 2 шарика. У нас может быть всего 4 комбинации: черный-черный, черный-белый, белый-черный, белый-белый. Вероятность, что будет 2 белых шара, примерно 15% (37,8% в квадрате), вероятность, что будет 2 черных шара, чуть меньше 40% (62,2% в квадрате). Остальные примерно 45% - это вероятность того, что будет 1 белый шар и 1 черный шар (нам не важно, в каком порядке мы их вытащим). Если у нас 3 шарика, то комбинаций уже 8, вероятность 3 белых шаров около 6%, вероятность 3 черных шаров около 35%, а скорее всего у нас будет 1 или 2 черных шара. Ну и так далее.
Есть понятные и достаточно легко выводимые формулы (вот например не очень заумное описание), есть функция в Excel под названием BINOMDIST (БИНОМРАСП), которая позволяет рассчитать вероятность для любого количества успешных исходов при определенном количество "попыток" (в нашем примере это вытаскиваемые шары) и определенной вероятности.
Например, если мы вытащили 1340 шариков из большого контейнера, в котором доля черных шаров составляет 62,2%, то вероятность, что в кучке окажется менее 60% черных шаров составляет 5,2%, а что более 65% - 1,8%. Менее 62% получится с вероятностью 43%, более 63% - с вероятностью 29% (и соответственно только 28% исходов придется на диапазон от 62% до 63%). Вероятность же того, что при округлении до десятых процента у нас получится ровно 62,2%, совсем небольшая - такой результат получится только если черных шаров будет 833 или 834, а вероятность любого из этих исходов составляет примерно 2,2% (4,5% в сумме). То есть только в каждой 22-ой кучке у нас доля черных шаров (округленная до десятых долей процента) будет такой же, как во всем контейнере - в остальных кучках она будет немного (на десятые доли процента или на несколько процентов) больше или меньше; в половине случаев отклонение будет 1% или более.

А теперь вместо шаров подставим избирателей. Кучки = избирательные участки, 1340 = среднее количество избирателей, проголосовавших на саратовских участках; 62,2% = результат Единой России на сомнительных участках; контейнер = все саратовские участки, где повторяется результат 62,2% (а точнее от 62,135% до 62,245%). Здесь мы на самом деле делаем два важных допущения В ПОЛЬЗУ предположения о честности саратовских избиркомов: во-первых, мы допускаем, что за Единую Россию в сумме по обсуждаемым участкам действительно проголосовало 62,2% избирателей (т.е. что в "контейнере" доля черных шаров действительно 62,2%); во-вторых, мы допускаем, что участки одинаковые по характеристикам избирателей, т.е. что белые и черные "шары" хорошо перемешаны и отличия между "кучками" по доле черных шаров случайны. На самом деле оба допущения конечно же не соответствуют действительности, но нам важно доказать, что даже при максимально лояльных к избиркомам допущениям полученные в Саратове результаты статистически невероятны (если мы предположим, что на самом деле вероятность голосования за Единую Россию в целом по городу не 62,2%, а меньше или больше, или если мы предположим, что между отдельными избирательными участками есть фундаментальные различия по составу электората, наша оценка вероятности попадания результата ЕР на конкретном участке в 62,2%, а точнее в диапазон 62,135%-62,245%, резко упадет). Вероятность (попадания точно в 62,2%) на уровне 4,5%, которая у нас посчиталась выше, - это максимально возможная, максимально лояльная к избиркомам оценка.
Итак, если в городе (районе, группе избирательных участков) за Единую Россию в среднем голосует 62,2%, то на участке с 1340 избирателями вероятность попадания результата (с точностью до десятых процента) в 62,2% составляет 4,5%. А вот на участке с 1341 избирателями вероятность такого попадания уже составляет всего лишь 2,2% - потому что в искомый диапазон попадает уже не 2 числа (833 и 834), а только одно (834). Если взять официальные данные по количеству проголосовавших по каждому из 107 прославившихся участков (а там по официальным цифрам голосовало от 550 до 1922 человек на каждом участке), то в среднем по этим участкам вероятность попадания результата ЕР в диапазон от 62,135% до 62,245% составляет 3,4% (разброс от 1,9% до 5,3%)

На картинке показано распределение саратовских участков по явке - с группировкой по "бинам" шириной в 0,1%. И для сравнения синенький холмик - распределение, которое должно было получиться, если бы все участки Саратова были бы примерно одинаковые, и различия между ними носили случайный характер (в реальности, с учетом экономических и социальных различий между районами города, "холмик" должен был бы быть еще более низким и широким)



Выше мы посчитали по отдельным участкам. А чтобы от этого перейти к оценке вероятности в целом по Саратову, мы смоделируем еще одно биномиальное распределение. В первом распределении у нас исходом было голосование или неголосование конкретного избирателя за Единую Россию. Во втором распределении таким исходом уже является попадание или непопадание результата ЕР на конкретном участке в 62,2%. Участков в Саратове 346, из них на 107 участках результат Единой России составил от 62,136% до 62,245%, вероятность попадания участка в этот диапазон в среднем 3,4%. При такой вероятности подобных участков должно было бы быть в Саратове около 12. А их оказалось 107! 95 сверхнормативных попаданий. Эксель даже не может посчитать вероятность такого "везения" - в какой-то момент он округляет до нуля. Но эксель может посчитать, что вероятность 10 и более попаданий сверх нормы (22 УИКа и более) составляет 0,4%, вероятность 20 попаданий сверх нормы уже в 9300 раз меньше - только 0,000045% (1 раз на 2,2 миллиона голосований). Максимум, что может посчитать эксель - 46 попаданий из 346: вероятность 1 на 180 триллионов. Дальше можно только примерно оценивать - для 107 попаданий у меня получилась вероятность примерно 10 в степени -44. Примерно как если бы в рулетке одно и то же число выпало 28 раз подряд. Вот у единоросов в Саратове точно такая же феноменальная стабильность и везение

Еще раз: вероятность того, что популярность в Саратове результата ЕР 62,2% получилась случайно (а не в результате рисования цифр) составляет не более 10-44

А вещь еще в Саратове было 35 участков, где результат Единой России чуть больше 62,2% - от 62,25% до 62,40%. Таких 35 участков. Вероятность, что эти 35 участков скучковались случайно, - 0,0001% или 1 случай на 945 тысяч. Так что математически фальсификации в Саратове доказываются даже не на 107 участках, а как минимум на 142 участках - это почти половина города.

P.S. Спасибо заинтересованному читателю, который не поленился продублировать мои расчеты. Похоже, что я сильно завысил вероятность саратовского совпадения. Для 107 участков вероятность совпадения получается не 10-44, а видимо что-то около 10-70 или 10-80

</sup>


  • 1
Хорошо написано. Проблема в том, что те, кому адресован текст, даже читать его не станут.

Ну а чего здесь хорошего? Использовать околонаучный бред для так называемых "доказательств" - выставлять себя идиотом. (И заодно - дискредитировать всё оппозиционные движения. Теперь путинская пропаганда может абсолютно обоснованно сказать - Смотрите какие смешные клоуны!

К выборам нельзя в принципе применять модели случайного распределения, так как результат складывается не из случайных, а из осознанных, целенаправленных действий. Более того, результат во многом формируется извне такими вещами как пропаганда, административный ресурс и т.д. И эти внешние воздействия приносят похожий эффект в каждом районе, в котором проживает более-менее одинаковый контингент. Если взять хоть сотню, хоть тысячу одинаковых шаров и катнуть каждый с одинаковым усилием по одинаковому покрытию, то (о какая "неожиданность"!) - абсолютно все шары пройдут абсолютно одинаковое расстояние (с учётом небольшой погрешности, из-за разного количества попавшихся на пути песчинок).
Т.е. 62.2% на каждом 4-ом участке, конечно, подозрительно, но с помощью теории вероятности ничего не докажешь. Модель такова, что теория, как раз, доказывает стремление к совпадению результатов. Кроме того, ещё есть куча факторов, которые могли поспособствовать получить одинаковый %. Например, - избирательному штабу было спущено задание обеспечить именно такой %. Они поагитировали, потом провели опросы, узнали какой % получился и пошли по квартирам добирать до заданного % бабушками. Как только набрали нужное число, сразу и остановились...

Про опросы - смешно. Ни один опрос - даже опрос всех выходящих с участка - не способен обеспечить точность на уровне 0,1%

Что касается случайности или неслучайности - результаты выборов на участке определяются выбором каждого из 1000-3000 избирателей, приписанных к участку. На выбор человека влияют сотни, а то и тысячи факторов, - начиная от того, где учились его родители и заканчивая тем, успел ли он выкопать картошку на даче на предыдущей неделе и не мешал ли в субботу водку с пивом. В результате получаются десятки и сотни тысяч факторов и событий, каждое из которых чуть-чуть влияет на общий результат УИКа. При таком количестве воздействий неслучайные процессы начинают себя вести уже также, как случайные

Про катнуть шары - неправильная аналогия. Шар - он цельный. Правильной аналогией было бы запускать каждый раз по 1500 шариков - притом шарики похожие друг на друга, но не одинаковые - и всякий раз обнаруживать, что до цели докатилось ровно 62,2% шариков

P.S. Отдельное веселье - читать фантазии апологетов Володина и вспоминать, как чуть ли не те же самые люди 5 лет назад старательно всех убеждали в том, что на каждый участок воздействует свой набор факторов, и даже внешне похожие участки могут голосовать за ЕдРо совершенно по-разному. Тяжело вам - теперь приходится уговаривать себя и других в противоположном


Меня момент с опросами тоже повеселил. Нанотехнологии еще не доросли, чтобы точность опросов была хотя бы 1%, даже в странах с вековой историей социологии.

Я и не утверждал, что опрос даёт результат с такой точностью. Просто, для примера привёл один из факторов увеличивающий кучность результата. А что, действительно смешно - это ваша притянутая за уши теория. Даже если эта цифра в 62.3% - результат махинаций, ваша теория не может это доказать, в принципе. Модель выстроена неверно. Это как, наблюдая закат солнца, сделать вывод что Земля плоская.

Вы мою аналогию не извращайте. Я абсолютно точно описал условия - шары ОДИНАКОВЫЕ. Что касается политической позиции, подавляющее большинство людей - это абсолютно одинаковые шары. Т.е. как личность, конечно, все люди разные. Но это к делу не относится. Так шары могут быть покрашены в разный цвет, но это не влияет на их кинетические свойства. А с точки зрения политики - все одинаковы. Одинаковы в том, что ни черта в этом не понимают, да и не хотят понимать. Что им в уши вольют, в то они и поверят. При такой технологии результат зависит только от производительности аппаратов "вливания". Сколько успеют обработать, или, возвращаясь к аналогии - сколько шариков толкнут, столько и покатятся в нужную сторону. Т.е. нельзя всерьёз говорить о случайности процесса, когда имеем дело с управляемым механизмом.

И да - спросите у любого, кто занимается политтехнологиями, он вам едва насчитает пятёрку факторов могущих действительно повлиять на результат. А уж где чьи родители учились - абсолютно до фонаря.


Пока наоборот у меня складывается ощущение, что это вы, слушая объяснения, почему солнце "закатывается", не верите - потому что точно знаете, что это Солнце вращается вокруг Земли
Я конечно не могу выстроить верную модель, потому что только вы знаете, каким критериям должна отвечать верная модель

Про производительность аппаратов вливания - бред. Во-первых, люди все-таки разные - и поэтому голосуют по-разному (и даже на одно и то же воздействие агитацией реагируют по-разному). Во-вторых, если якобы все дело в мощности аппарата вливания - так уж за 17 лет он мог бы окучить всех. Но не смог. Даже в Саратове "почему-то" результаты ЕР отличаются по участкам на десятки процентов [но если уж оказываются около 60-65%, то почти наверняка точно на 62,2%. В-третьих, профессия политтехнологов - продавать задорого миф о своем могуществе. Да, политтехнологи могут повлиять на результат, особенно если на выборах конкурируют не очень известные кандидаты - но даже самый гениальный политтехнолог не сможет особо изменить географию электоральных предпочтений: в 2012 году в большинстве районов Москвы Путин получил такой же результат (с точностью до процента), как и в 2000 году, за 12 лет до того. Вся пропаганда ничего не смогла сделать с тем, что жители Капотни любят Путина ровно на X% больше, чем жители ЦАО

По рассуждениям на тему "выборы не подчиняются законам тервера" Несмиян вот здесь прошелся, я просто процитирую (там не саратовская история, а распределение голосов по явке, но не суть, даже нагляднее):

Графики для всех партий подчиняются тому самому распределению Гаусса несмотря на размеры страны, особенности голосования "город-село", погоду, смерчи, уборочный сезон, ПМС и все такое прочее, включая свободу воли. Но график Единой России начисто выбивается из указанной закономерности. Совсем.

Единая Россия, как видно, живет по своему собственному закону распределения, который полностью выбивается из тех законов, по которым набирали голоса все остальные. Вот этот момент во всех объяснениях как раз и отсутствует. Объяснений этого феномена нет ни у кого. Видимо потому, что объяснить его иначе, чем фальсификациями, невозможно, а большое количество умных слов призвано лишь прикрыть этот прискорбный факт.


"Замечательный" аргумент в стиле - мой коллега доказал, что 2+2=4, значит и моя теория про то, что в Антарктиде живут попугаи, тоже верна. )))

То есть вы согласны - голосование за Единую Россию имеет к голосованию за другие партии ровно то же отношение, что и попугаи к арифметике. Собственно, это и имел ввиду Несмиян.

Ну с абсолютизацией Гаусса я тоже не соглашусь. Есть известные примеры, когда без всяких фальсификаций распределения выглядят совсем не колоколообразно. Из классики - Израиль (где графики распределений "портят" арабские кварталы и кварталы иудеев-ортодоксов) и крупные американские города (где Гауссу противоречат негритянские гетто с близкой к 100% поддержкой демократов)

Соглашусь - выбросы могут быть. В нашей стране в том числе - Северный Кавказ, та же Мордовия с большим количеством подневольных ИВК (в скобках: это, разумеется, ничего общего не имеет с демократией - но отнюдь не означает фальсификации). Но даже этим фактором трудно объяснить выброс выше колокола, и совсем невозможно - пики на "круглых" 65%, 70%, 75% etc.

Ссылаться на Несмияна это днище.

Не будем ссылаться на Несмияна. Будем отвечать на вопрос "почему Единая Россия живет по своему собственному закону распределения, который полностью выбивается из тех законов, по которым набирали голоса все остальные".

Или нечего ответить?

"Как только набрали нужное число, сразу и остановились".

ААААААААААААААА!!!!

Чувак гений! В одну секунду обрушил весь рынок политтехнологий. "А мужики-то не знали..."

  • 1
?

Log in

No account? Create an account