Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
Володинские 62,2% в Саратове: математическое доказательство фальсификации для чайников
barouh

Последние дни много веселья про результаты выборов в Саратове, где более чем на четверти участков результат Единой России оказался ровно 62,2% с точностью плюс-минус несколько сотых процента. Вот тут наглядно. Особой пикантности придает тот факт, что в Думу от Саратовской области баллотировался Володин - зампред президентской администрации, куратор всех выборов и будущий спикер Госдумы

На уровне базовой вменяемости понятно, что не может быть такое совпадение результатов на десятках участков. Но люди просят ДОКАЗАТЕЛЬСТВ. Ну что же, объясняю на пальцах и с цифрами. Математическое доказательство того, что результаты выборов по Саратову фальсифицированы

Для начала представьте себе огромный контейнер, в котором много-много (больше 100 тысяч) шаров. Белые и черные. Черных больше - 62,2% от всех. Шары равномерно и добросовестно перемешаны - т.е. в любой части контейнера соотношение белых и черных шаров примерно одинаковое
Теперь мы вслепую достаем шары из этого контейнера и раскладываем по кучкам. Пусть в каждой кучке у нас будет 1340 шаров. Сколько в каждой кучке будет черных шаров? Можем ли мы быть уверены, что в каждой кучке доля черных шаров будет именно 62,2%, а не скажем 62,0%, 62,4% или 65,0%? Тут нам на помощь приходит математика биномиального распределения. Биномиальное распределение - это такое случайное распределение, у которого может быть только два значения (0 или 1, "да" или "нет") и у которого есть определенная вероятность, что случится исход "да". Вокруг этого построен большой и важный раздел теории вероятности, и здесь используется четкая и легко доказуемая математика
Прежде чем с помощью тервера отвечать на условно сложный вопрос про 1340 шаров, давайте посмотрим на простую ситуацию - вытаскиваем 2 шарика. У нас может быть всего 4 комбинации: черный-черный, черный-белый, белый-черный, белый-белый. Вероятность, что будет 2 белых шара, примерно 15% (37,8% в квадрате), вероятность, что будет 2 черных шара, чуть меньше 40% (62,2% в квадрате). Остальные примерно 45% - это вероятность того, что будет 1 белый шар и 1 черный шар (нам не важно, в каком порядке мы их вытащим). Если у нас 3 шарика, то комбинаций уже 8, вероятность 3 белых шаров около 6%, вероятность 3 черных шаров около 35%, а скорее всего у нас будет 1 или 2 черных шара. Ну и так далее.
Есть понятные и достаточно легко выводимые формулы (вот например не очень заумное описание), есть функция в Excel под названием BINOMDIST (БИНОМРАСП), которая позволяет рассчитать вероятность для любого количества успешных исходов при определенном количество "попыток" (в нашем примере это вытаскиваемые шары) и определенной вероятности.
Например, если мы вытащили 1340 шариков из большого контейнера, в котором доля черных шаров составляет 62,2%, то вероятность, что в кучке окажется менее 60% черных шаров составляет 5,2%, а что более 65% - 1,8%. Менее 62% получится с вероятностью 43%, более 63% - с вероятностью 29% (и соответственно только 28% исходов придется на диапазон от 62% до 63%). Вероятность же того, что при округлении до десятых процента у нас получится ровно 62,2%, совсем небольшая - такой результат получится только если черных шаров будет 833 или 834, а вероятность любого из этих исходов составляет примерно 2,2% (4,5% в сумме). То есть только в каждой 22-ой кучке у нас доля черных шаров (округленная до десятых долей процента) будет такой же, как во всем контейнере - в остальных кучках она будет немного (на десятые доли процента или на несколько процентов) больше или меньше; в половине случаев отклонение будет 1% или более.

А теперь вместо шаров подставим избирателей. Кучки = избирательные участки, 1340 = среднее количество избирателей, проголосовавших на саратовских участках; 62,2% = результат Единой России на сомнительных участках; контейнер = все саратовские участки, где повторяется результат 62,2% (а точнее от 62,135% до 62,245%). Здесь мы на самом деле делаем два важных допущения В ПОЛЬЗУ предположения о честности саратовских избиркомов: во-первых, мы допускаем, что за Единую Россию в сумме по обсуждаемым участкам действительно проголосовало 62,2% избирателей (т.е. что в "контейнере" доля черных шаров действительно 62,2%); во-вторых, мы допускаем, что участки одинаковые по характеристикам избирателей, т.е. что белые и черные "шары" хорошо перемешаны и отличия между "кучками" по доле черных шаров случайны. На самом деле оба допущения конечно же не соответствуют действительности, но нам важно доказать, что даже при максимально лояльных к избиркомам допущениям полученные в Саратове результаты статистически невероятны (если мы предположим, что на самом деле вероятность голосования за Единую Россию в целом по городу не 62,2%, а меньше или больше, или если мы предположим, что между отдельными избирательными участками есть фундаментальные различия по составу электората, наша оценка вероятности попадания результата ЕР на конкретном участке в 62,2%, а точнее в диапазон 62,135%-62,245%, резко упадет). Вероятность (попадания точно в 62,2%) на уровне 4,5%, которая у нас посчиталась выше, - это максимально возможная, максимально лояльная к избиркомам оценка.
Итак, если в городе (районе, группе избирательных участков) за Единую Россию в среднем голосует 62,2%, то на участке с 1340 избирателями вероятность попадания результата (с точностью до десятых процента) в 62,2% составляет 4,5%. А вот на участке с 1341 избирателями вероятность такого попадания уже составляет всего лишь 2,2% - потому что в искомый диапазон попадает уже не 2 числа (833 и 834), а только одно (834). Если взять официальные данные по количеству проголосовавших по каждому из 107 прославившихся участков (а там по официальным цифрам голосовало от 550 до 1922 человек на каждом участке), то в среднем по этим участкам вероятность попадания результата ЕР в диапазон от 62,135% до 62,245% составляет 3,4% (разброс от 1,9% до 5,3%)

На картинке показано распределение саратовских участков по явке - с группировкой по "бинам" шириной в 0,1%. И для сравнения синенький холмик - распределение, которое должно было получиться, если бы все участки Саратова были бы примерно одинаковые, и различия между ними носили случайный характер (в реальности, с учетом экономических и социальных различий между районами города, "холмик" должен был бы быть еще более низким и широким)



Выше мы посчитали по отдельным участкам. А чтобы от этого перейти к оценке вероятности в целом по Саратову, мы смоделируем еще одно биномиальное распределение. В первом распределении у нас исходом было голосование или неголосование конкретного избирателя за Единую Россию. Во втором распределении таким исходом уже является попадание или непопадание результата ЕР на конкретном участке в 62,2%. Участков в Саратове 346, из них на 107 участках результат Единой России составил от 62,136% до 62,245%, вероятность попадания участка в этот диапазон в среднем 3,4%. При такой вероятности подобных участков должно было бы быть в Саратове около 12. А их оказалось 107! 95 сверхнормативных попаданий. Эксель даже не может посчитать вероятность такого "везения" - в какой-то момент он округляет до нуля. Но эксель может посчитать, что вероятность 10 и более попаданий сверх нормы (22 УИКа и более) составляет 0,4%, вероятность 20 попаданий сверх нормы уже в 9300 раз меньше - только 0,000045% (1 раз на 2,2 миллиона голосований). Максимум, что может посчитать эксель - 46 попаданий из 346: вероятность 1 на 180 триллионов. Дальше можно только примерно оценивать - для 107 попаданий у меня получилась вероятность примерно 10 в степени -44. Примерно как если бы в рулетке одно и то же число выпало 28 раз подряд. Вот у единоросов в Саратове точно такая же феноменальная стабильность и везение

Еще раз: вероятность того, что популярность в Саратове результата ЕР 62,2% получилась случайно (а не в результате рисования цифр) составляет не более 10-44

А вещь еще в Саратове было 35 участков, где результат Единой России чуть больше 62,2% - от 62,25% до 62,40%. Таких 35 участков. Вероятность, что эти 35 участков скучковались случайно, - 0,0001% или 1 случай на 945 тысяч. Так что математически фальсификации в Саратове доказываются даже не на 107 участках, а как минимум на 142 участках - это почти половина города.

P.S. Спасибо заинтересованному читателю, который не поленился продублировать мои расчеты. Похоже, что я сильно завысил вероятность саратовского совпадения. Для 107 участков вероятность совпадения получается не 10-44, а видимо что-то около 10-70 или 10-80

</sup>


  • 1
По рассуждениям на тему "выборы не подчиняются законам тервера" Несмиян вот здесь прошелся, я просто процитирую (там не саратовская история, а распределение голосов по явке, но не суть, даже нагляднее):

Графики для всех партий подчиняются тому самому распределению Гаусса несмотря на размеры страны, особенности голосования "город-село", погоду, смерчи, уборочный сезон, ПМС и все такое прочее, включая свободу воли. Но график Единой России начисто выбивается из указанной закономерности. Совсем.

Единая Россия, как видно, живет по своему собственному закону распределения, который полностью выбивается из тех законов, по которым набирали голоса все остальные. Вот этот момент во всех объяснениях как раз и отсутствует. Объяснений этого феномена нет ни у кого. Видимо потому, что объяснить его иначе, чем фальсификациями, невозможно, а большое количество умных слов призвано лишь прикрыть этот прискорбный факт.


"Замечательный" аргумент в стиле - мой коллега доказал, что 2+2=4, значит и моя теория про то, что в Антарктиде живут попугаи, тоже верна. )))

То есть вы согласны - голосование за Единую Россию имеет к голосованию за другие партии ровно то же отношение, что и попугаи к арифметике. Собственно, это и имел ввиду Несмиян.

Повторюсь, я ни разу не утверждал, что эти выборы были честными вообще, и что эти саратовские 62.3% - не результат махинаций, в частности. Просто, эта теория - полная лажа и не годится для доказательства факта махинаций.

Какая именно теория - "полная лажа"? То, что график "результат по явке" подчиняется законам нормального распределения?

Нет. Лажа - то, что городит barouh. А та версия абсолютно логична. Правда, и она никак не объясняет причины таких аномальных отклонений. На каких-то участках это может быть примитивный вброс бюллетеней, но не под камерами, а - в промышленных масштабах, когда перед подсчётом к реальным урнам подвозят парочку заполненных заранее. (под камерами, одиночными набегами не задерживаясь долго перед урной, можно засунуть десяток-другой листков за день, а чтобы запихать, скажем, 500-700 бюллетеней, надо работать не отрываясь не один час.) На каких-то участках, не заморачиваясь, просто пририсовали к итоговому протоколу. Но были и такие участки, где народу просто приказали прийти и проголосовать как надо. Например, 100% явка в воинских частях меня не удивит, от слова совсем. 99% явка на передвижном избирательном участке в тундре, меня не удивит тоже. Если к тебе в посёлок 2 раза в год прилетает вертолёт, то не придёт к нему только тот, кто внезапно умер. Или такие, исконно русские регионы как Чечня. Вы думаете, там знают фамилию какого-нить другого российского Путина? Им отец-Рамзан скажет: дело государственной важности - завтра пойдите и проголосуйте за партию Путина! Думаете много найдётся таких, кто не послушает?
Да мало ли уловок можно придумать, чтобы привезти на избирательные участки тех, кто голосовать не собирался? Знаю историю, когда голоса покупались за ...банку консервированных огурцов. Более приличные случаи: зазывали на концерт по случаю выборов, или - предлагали довезти на автобусе до избирательного участка (намекая, что по дороге нальют стопочку, ведь выборы - это праздник). Ну и за кого, по вашему, проголосует этот контингент? Те, кто точно настроен против власти, на выборы не поедут как ни зови, даже за бутылку. А тех, кто соглашается, современные порядки вполне устраивают. ...И даже если и не устраивают, за кого ещё они могут проголосовать? За Зюганова, что-ли?!

В чем же лажа у Баруха? Ужель есть какое-то иное мало-мальски вменяемое объяснение шпилю имени Памфиловой на графике? Ok, к черту скучную математику; но вот же, наглядно и в одной картинке!

Вы упорно не желаете понять одну простую вещь. Нарушения и фальсификации описанных вами типов могут дать прирост ЕР до любой разумной цифры; но при этом, скажем, на одном условно участке будет 23%, на другом 28%, на третьем 26% и еще на пятнадцати в разбросе от 85 до 95. В разбросе, Карл! Сделать так, чтобы на всех упомянутых пятнадцати было ровно 89.8%, ни больше и не меньше - никакой Кадыров не сможет. Ни за продукты, ни за бутылку водки, ни ротой солдат, ни пририсовками. Это можно сделать только и исключительно одним способом: умножить явку на эти самые 0.622 и вписать результат в графу "За ЕР".

А Борух всего лишь посчитал вероятность случайного появления этой заветной цифры для наудачу (наудачу! хотя реально большинство таких участков идет подряд) 107-и участках из 346-ти имеющихся.

Объяснения у меня нет. Но и применять теорию случайных чисел к процессу регулируемому одним кукловодом - глупость.
Я бы ограничился фразой - очень странное совпадение, но доказательств нет.

И да, если уж всерьёз осуждать вашу версию, то объясните мне - почему надо перемножать на такое неудобное число?
- Почему бы не перемножать хотя-бы на 0.6 (а лучше - просто поделить на 2, или умножить на 1)?
- А если это придумали такие умные, которые догадались, что круглый % вызовет подозрение, и добавили дробных чисел после запятой, то почему они не додумались перемножать разные участки на разные коэффициенты?

Или вы полагаете, что это делалось не вручную, а внося правки в центризбиркомовскую программу подсчёта результатов, чтобы она автоматом при сведении результатов вносила корректировки в исходные таблицы? Тогда почему тот же коэффициент не был добавлен к остальным Саратовским участкам? Или - к 25% участков в других городах? Если в центральной программе баг - то он действует на всё.


очень странное совпадение, но доказательств нет.
Совпадений с вероятностью "десять в минус восьмидесятой" не бывает. Вот не бывает, и все тут. И "нет" здесь не доказательств, а любого иного, кроме нарисованных результатов, разумного объяснения. Можно считать - доказательство от противного.

почему надо перемножать на такое неудобное число?
Это не мое странное число. Это странное число указано на сайте ЦИК - 62.2%. Остальная "магическая формула" - элементарные операции с дробями/процентами.

А если это придумали такие умные <...>
Придумал один, исполняли другие. Причем много других (107 минимум).

внося правки в центризбиркомовскую программу подсчёта результатов
Нет, я так не полагаю. Потому хотя бы, что на уровне УИК-ов нет программ - там банальный подсчет вручную, после чего подписанный итог везется председателем в ТИК. В нашем случае - считали не бюллетени, а результат по формуле выше.

Кстати, о теории вероятности. Шанс, что выпадет флэш-стрит составляет 1 из 10 000. А я за домашним столом видел его 2 раза с перерывом недели в 2. Т.е - 2 из ~200. Пропорция нормального распределения вероятностей нарушена аж в 100 раз.

1. Вбросы в урну - это примитивная технология. Проще сразу в протокол и ГАС выборы вносить придуманные цифры
2. Про Чечню - не более чем предположение. Про Дагестан тоже много говорили про то, какая там мол особая культура и что там правда явка 100%. А как поставили камеры и как появилось хотя бы несколько независимых наблюдателей на всю республику, так оказалось, что явка 20-25%, а местами и 7-10%
3. Мелкие и удаленные избирательные участки оказывают очень небольшое влияние на результаты выборов, их географию и на траектории кривых распределения. На участках размером менее 100 человек приходится только 0,2% российских избирателей

Ну с абсолютизацией Гаусса я тоже не соглашусь. Есть известные примеры, когда без всяких фальсификаций распределения выглядят совсем не колоколообразно. Из классики - Израиль (где графики распределений "портят" арабские кварталы и кварталы иудеев-ортодоксов) и крупные американские города (где Гауссу противоречат негритянские гетто с близкой к 100% поддержкой демократов)

Соглашусь - выбросы могут быть. В нашей стране в том числе - Северный Кавказ, та же Мордовия с большим количеством подневольных ИВК (в скобках: это, разумеется, ничего общего не имеет с демократией - но отнюдь не означает фальсификации). Но даже этим фактором трудно объяснить выброс выше колокола, и совсем невозможно - пики на "круглых" 65%, 70%, 75% etc.

Забавно, а почему тогда у вас не вызывает подозрений пик на 50% явки? Потому что там есть синхронный, пик по всем партиям, а на 65%, 70%, 75% - он не так ярко выражен? )))
А может всё проще - либо автор, составляя диаграмму сначала вбивал точные цифры, а потом плюнул и суммировал голоса, округляя по дискретным точкам - 50, 55, 65 ...? Или наоборот - местным ЦИКам была спущена команда - до какой именно цифры надо поднять явку? Причём, это тоже не обязательно прямые фальсификации. Могли просто ходить по домам с переносными урнами и заставлять голосовать бабушек, пока не набрали нужный %.

Edited at 2016-09-26 04:50 pm (UTC)

Вызывает. И не только на 50%, я же написал - "и т.д. и т.п.". Синхронный рост, к слову, есть и на 65-70-75% имеются, пусть и не такие выраженные. Кстати, эти пики по стальным партиям доказывают именно рисование - никто бы не стал вбрасывать вместе с ЕР заодно и за КПРФ, ЛДПР, далее по списку. Вывод - поднимали в основном явку, и поднимали более-менее пропорционально; так, чтобы результат ЕР не стал совсем уж неприличным (например - в районе 86%).

автор, составляя диаграмму сначала вбивал точные цифры, а потом плюнул и суммировал голоса, округляя по дискретным точкам - 50, 55, 65 ...?
Уверен, автор ни одной цифры не вбил вовсе - что ему, делать больше нечего?? Все цифры с сайта ЦИК, уже в электронном виде, бери и используй. Зачем же вбивать их вручную заново??

Могли просто ходить по домам с переносными урнами и заставлять голосовать бабушек, пока не набрали нужный %.

Ога, я так и вижу: носят под домам штук 50 урн и после каждой квартиры созваниваются все пятьдесят и сверяются: достигли вкупе заветных 65-70-75? Нет? Ну, тогда еще по одной квартирке. До созвона, да.

Ну, зачем же абсолютно везде искать теорию заговора? :) Скорее более высокая явка отчасти могла быть обусловлена объективными причинами, удобным расположением, например. Или там - хорошей организацией предвыборной компании на отдельных участках, и наконец - грамотной стимуляцией активности граждан в день выборов. Поэтому, как и подразумевают законы статистики, пропорционально явке виден всплеск количества голосов по всем партиям. В чём тут признаки рисования? Если на реальный всплеск активности наложить некоторое количество, притянутых за уши голосователей за ЕР, то и получим как раз такую картинку. Т.е. если в некоем районе, например, Зюганская братва развернула серьёзную агитацию и, заметив это, тут же подтянулись агитаторы остальных партий, то вполне возможно что они совместными усилиями разбудили не среднестатистические 36, а - 50% избирателей. И мы имеем пики, более менее соответствующие симпатиям избирателей в среднем по стране. А потом добавляют ещё 10-15% чисто за едросов и их пик взлетает уже далеко за пределы пропорций.

Во первых, это только предположение, чисто чтобы проиллюстрировать насколько простые и невинные вещи могут привести к таким помехам. А во-вторых, лень проверять, но я почти уверен, что информация там представлена в таком неудобном виде, что без дополнительной обработки её использовать невозможно. Как минимум - идёт не одним потоком, а разбита на сотни файлов по областям.

Переносных урн (команд "добровольцев" в штате) на участке дай бог, чтобы пара-тройка была. Не вижу проблем отзвониться главному и доложить - я собрал столько-то, можно я уже закончу на этом? И 1-2 лишних голоса дело не решают. 1% от 1500 - это 15 бюллетеней.

Данные с циковского сайта давно выкачаны и собраны в простые и удобные эксельки

А что агитаторы могут поднять явку почти в 1,5 раза - это бред. Вон в Москве - Тушинский округ. Три кандидата с большими бюджетами (Онищенко, Гудков, Коротченко), куча агитации - чуть ли не на порядок больше, чем в любом другом округе Москвы. Гудковские агитаторы по квартирам ходили. И что? Явка практически такая же, как и в остальной Москве

«…никто бы не стал вбрасывать вместе с ЕР заодно и за КПРФ, ЛДПР, далее по списку…»

Это теорема. Но она не верна:

http://www.novayagazeta.ru/news/61531.html

Не вижу причины единичный случай для одной партии обобщать на все партии по всей РФ.

Один этот пример полностью опровергает теорему о том, что фальсификации делались только в пользу ЕР. Нет - не только.

Ссылаться на Несмияна это днище.

Не будем ссылаться на Несмияна. Будем отвечать на вопрос "почему Единая Россия живет по своему собственному закону распределения, который полностью выбивается из тех законов, по которым набирали голоса все остальные".

Или нечего ответить?

Без предварительных исследований электоральных процессов России (корреляционный, регрессионный, пат-анализ etc.) на Ваш вопрос ответить ничего определённого невозможно. Если конечно не спрашивать таких как Несмиян - эти запросто дадут ответ на любой вопрос )

То есть в России все же несколько "электоральных процессов". Один - для ЕР, и другой - для всех остальных. В таком случае - пока мне не предложат непротиворечивую разумную гипотезу для объяснения такого удивительного феномена - я, пожалуй, воспользуюсь принципом бритвы Оккама.

Как то очень странно у Вас логика работает. Вот я вообще же никаких характеристик процессам не давал, а Вы делаете вывод, что их, процессов, аж несколько. Но это не из моих слов следует, а из Ваших каких-то думок. Для чего Вы мне это озвучиваете?

«…В таком случае - пока мне не предложат непротиворечивую разумную гипотезу для объяснения такого удивительного феномена - я, пожалуй, воспользуюсь принципом бритвы Оккама…»

Вены вскроете? Не надо этого делать. От этого бритва начнёт ржаветь )

  • 1
?

Log in

No account? Create an account