Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Невероятные совпадения: история вопроса
barouh

Уж коли зашла речь про невероятные совпадения, когда куча УИКов в одном районе или городе показывают одинаковые результаты, применительно к выборам 2016 года и 2011 года, то интересно посмотреть на эту тему в ретроспективе. Оказывается, kobak это посчитал еще 4 года назад - но все это время результаты пылились в почтовых ящиках и ни разу опубликованы не были. С разрешения автора исправляю

Итак, список ТИКов с аномально низкой для случайного распределения дисперсией (p<0,0001). Дисперсия считалась по половине участков каждого ТИКа - по тем участкам, на которых результат ЕР ближе к медиане. Соответственно, "сгустки", в которые попадает менее половины участков района, в этот список не вошли (поэтому в частности тут нет питерских совпадений 2012 года и есть некоторые несовпадения с моими списками)

Но тренд все равно хорошо видно: в 2000 еще таких однотипных рисовок результатов не было, в 2003 они появились и далее становились все более распространенными. Так, в 2008 они впервые появились за пределами республик - в Кемеровской области. Тренд казалось бы был переломлен в 2012 году, когда количество ТИКов с массовыми однотипными рисовками результатов сократилось в 3 раза.



Но как мы теперь знаем, это был не перелом тренда - а временное отступление. В 2016 году количество рисованных ТИКов выросло снова к уровням 2008 и 2011 годов или даже выше (прямое сопоставление - где больше - пока никем не сделано; я пишу о 50 ТИКах с аномальными "сгустками" в 2016 году, но я использую немного иную методику, и часть выявленных мною "сгустков" алгоритм Кобака не увидел бы)

список аномальных ТИКов по годамCollapse )


Чечня, Башкирия, Саратов, Тюмень: 51 ТИК, в которых фальсификация доказывается математически
barouh
Про саратовскую аномалию 62,2% и количественную оценку (не)вероятности тамошней кучности результатов Единой России я уже писал. Заодно я там рассказал про методику оценки того, что более чем на сотне участков доля голосов за ЕР случайным образом совпадет с точностью до десятой доли процента - это делается через два биномиальных распределения (краткий пересказ методики см. в конце данного поста). Но Саратов - лишь один из примеров. Всего удалось выявить 51 "сгусток" со статистически невероятной концентрацией результатов Единой России на том или ином проценте в пределах одного ТИКа (города, района, городского района).

Все эти 51 "сгусток" приходятся на 11 регионов - это Саратовская и Тюменская области (в обоих случаях - только районы областного центра), Кемеровская область, Ханты-Мансийский округ и республики - Дагестан, Чечня, Ингушетия, Кабардино-Балкария, Карачаево-Черкессия (т.е. все северокавказские, кроме Осетии и Адыгеи), а также Татарстан и Башкирия. Примечательно, что в большинстве из этих регионов - во всех, кроме ХМАО и КЧР - "сгустков" сразу несколько: не менее трех на регион.



Ниже в таблице перечислены все "сгустки", для которых вероятность их случайного образования составляет менее 0,006% (1 случай на 17 тысяч). Казалось бы, 0.006% - не такая уж и маленькая вероятность. Но: как сказано выше, в этих же регионах (за исключением ХМАО) встречаются и другие "сгустки" - уже с вероятностями менее 0,000005% (менее 1 случая на 20 миллионов). Получается, что концептуально между вероятностью 10-5 и скажем 10-12 нет никакой разницы - и те, и те "совпадения" возможны только в одних и тех же специфических регионах, и совпадение их географии - наглядное доказательство того, что "сгустки" с вероятностью 10-5 - это тоже фальсификации, прямые "рисовки" результатов.

В сумме на 51 "сгусток" приходится 1566 участков, на которых проголосовало почти 2 миллиона человек (1984 тысячи), из них 1417 тыс. за Единую Россию. То есть каждый 20-ый голос, полученный ЕР по стране, нарисован в этих "сгустках". И по хорошему результаты по всем этим участкам надо отменять. Или как минимум инициировать проверку ЦИКа - с привлечением к ней представителей партий и общественных организаций

Итак, таблица (полная версия)

ТИК диапазон кол-во и доля УИКов вероятность
Кабардино-Балкарская Республика
Прохладненская городская 78,35%-78,46% 20 УИКов (100%) 5,3E-27
Эльбрусская 78,43%-79,72% 21 УИКов (100%) 3,6E-10
Нальчикская городская 76,03%-77,97% 86 УИКов (84%) 2,3E-07
Карачаево-Черкесская Республика
Черкесская городская 76,41%-78,14% 51 УИКов (98%) 6,1E-12
Прикубанская 83,08%-83,71% 18 УИКов (78%) 3,3E-10
Кемеровская область
Полысаевская городская 72,45%-73,22% 20 УИКов (100%) 2,3E-14
Топкинская 80,57%-81,93% 34 УИКов (69%) 4,0E-08
Юргинская городская 80,48%-82,47% 40 УИКов (98%) 6,6E-07
Березовская городская 72,46%-73,41% 17 УИКов (68%) 4,0E-08
Анжеро-Судженская городская 72,16%-74,15% 45 УИКов (75%) 4,6E-05
Мысковская городская 71,76%-72,75% 18 УИКов (72%) 6,0E-05
Республика Башкортостан
Стерлитамакская городская 54,41%-56,4% 97 УИКов (84%) 2,1E-12
Октябрьская 52,74%-53,68% 30 УИКов (73%) 4,5E-10
Салаватская городская 50,99%-51,05% 12 УИКов (19%) 1,2E-08
Уфа, Калининская 47,54%-49,04% 52 УИКов (76%) 1,1E-07
Уфа, Кировская 46,21%-48,16% 56 УИКов (74%) 3,5E-06
Уфа, Орджоникидзевская 49,92%-50,1% 15 УИКов (23%) 4,3E-06
Стерлибашевская 61,73%-62,71% 16 УИКов (48%) 6,6E-06
Уфа, Демская 50,96%-51,42% 14 УИКов (42%) 1,0E-05
Республика Дагестан
Дахадаевская 91,07%-92,45% 42 УИКов (75%) 2,6E-08
Сулейман-Стальская 89,85%-90,35% 23 УИКов (55%) 1,9E-07
Сергокалинская 95,89%-96,06% 13 УИКов (45%) 3,1E-07
Республика Ингушетия
Назрановская 70,24%-71,05% 23 УИКов (79%) 7,4E-09
Малгобекская городская 72,34%-73,7% 19 УИКов (90%) 5,3E-07
Сунженская 73,93%-74,1% 10 УИКов (38%) 1,6E-06
Республика Татарстан (Татарстан)
Зеленодольская городская 79,97%-80,14% 15 УИКов (39%) 4,3E-08
Нурлатская 98,97%-99,84% 43 УИКов (98%) 9,0E-07
Набережные Челны, Комсомольская 79,54%-80% 23 УИКов (49%) 3,5E-06
Лениногорская городская 86,93%-87,12% 11 УИКов (46%) 6,4E-06
Елабужская городская 84,78%-86,01% 31 УИКов (79%) 8,3E-06
Казань, Приволжская 74,82%-75,32% 30 УИКов (34%) 2,2E-05
Казань, Советская 74,04%-76,04% 78 УИКов (75%) 4,7E-05
Саратовская область
Саратов, Заводская 61,69%-62,82% 54 УИКов (76%) 5,5E-13
Саратов, Кировская 62,14%-62,29% 17 УИКов (27%) 2,8E-09
Саратов, Октябрьская 61,99%-62,81% 30 УИКов (56%) 2,5E-07
Саратов, Ленинская 61,48%-63,46% 83 УИКов (73%) 2,6E-06
Саратов, Фрунзенская 62,14%-62,34% 9 УИКов (36%) 1,0E-05
Тюменская область
Тюмень, Центральная 47,72%-47,96% 26 УИКов (36%) 2,1E-09
Тюмень, Центральная 38,21%-38,66% 30 УИКов (41%) 2,1E-09
Тюмень, Восточная 48,9%-50,13% 41 УИКов (71%) 2,1E-07
Тюмень, Ленинская 48,37%-48,46% 10 УИКов (22%) 1,2E-06
Тюмень, Калининская 48,96%-49,44% 28 УИКов (35%) 1,7E-06
Ханты-Мансийский автономный округ – Югра
Нефтеюганская 91,95%-92,03% 9 УИКов (36%) 2,8E-06
Чеченская Республика
Урус-Мартановская 97,37%-97,66% 36 УИКов (100%) 1,7E-19
Шалинская 95,42%-95,66% 27 УИКов (100%) 1,2E-19
Ножай-Юртовская 95,7%-96,21% 32 УИКов (100%) 1,8E-18
Гудермесская 97,53%-97,91% 45 УИКов (96%) 3,2E-16
Наурская 96,35%-96,55% 19 УИКов (100%) 9,7E-15
Грозный, Заводская 95,19%-95,39% 15 УИКов (100%) 1,7E-12
Шелковская 95,6%-96,17% 26 УИКов (100%) 4,7E-12
Сунженская 93,52%-93,72% 6 УИКов (86%) 2,9E-05

Примечательно, что за пределами вышеперечисленных 11 регионов случилось только два совпадения, вероятность которых получается меньше 0,1% - в одном из районов Челябинска 8 участков попали в диапазон от 31,79% до 31,88% за Единую Россию (вероятность такого совпадения в 4 раза выше, чем у замыкающего приведенную ниже таблицу "сгустка" в городе Мыски) , а в Большемурашкинском районе Нижегородской области сразу 9 участков (из 19) показали результат ЕР от 65,00% до 65,50% - но последний случай это как раз тоже явная фальсификация.

Про некоторые из "сгустков", попавших в таблицу выше, хочется сказать подробнее

(1) Город Прохладный в Кабардино-Балкарии. Безусловный рекордсмен, где все 20 участков уложились в диапазон от 78,35% до 78,46% за Единую Россию (не спрашивайте меня, почему именно 78,4% - не знаю). Там еще и явка почти совпадает (разброс от 88,6% до 90,3%), и проценты за другие партии (например, у КПРФ везде 18,8%, и только на одном участке 1 лишний голос - так что получилось 18,9%; у "эсеров" 2,0% плюс минус 0,1%; на четвертом месте везде "зеленые" везде с 0,3%; у Яблока ни одного голоса во всем городе; также в городе ни одного недействительного и ни одного попутавшего КПРФ и КПКР)
(2) Центральный район Тюмени. Это единственный ТИК, в котором обнаружилось сразу два "сгустка". Но примечательно даже не это, а то, какие именно проценты там рисовались. Более трети участков (36%) попали по голосованию за ЕР в диапазон чуть шире 0,2% - от 47,72% до 47,96%. Рисовали менее 48% - тогда как в большинстве других "сгустков" у Единой России 70% и более. Но это еще не все: в том же Центральном районе еще 30 участков (41% от всех УИКов района) показали результат за ЕР между 38% и 39% - что как раз примерно соответствует среднему результату ЕР по нефальсифицированным участкам в крупных городах. Притом в сытой, осыпанной нефтяными деньгами Тюмени даже в центре города поддержка Единой России должна быть выше среднего - так что похоже, что на части участков в Центральном районе Тюмени ЕР нарисовали процент меньше реального (впрочем, при рисованной явке около 75-80% ЕР все равно осталась в выигрыше по количеству полученных голосов). При 38,х% за Единую Россию совпадают и результаты других партий - у эсеров всегда 22% с копейками, у КПРФ 21%, у ЛДПР 17%, у остальных не более 0,2%.
Замечательная иллюстрация рисования результатов - участок 2220. Там при вводе данных промахнулись, и у КПРФ и эсеров оказалось по 0 голосов, тогда как их стандартные результаты - 21% и 22% - сместились на одну строчку вверх и оказались записаны соответственно на Яблоко и Патриотов России. Понятно, что это просто ошибка при вводе данных - но показательно, что подобные ошибки встречаются только там, где рисовали результаты.
В завершение темы Тюмени - "сгустки" есть и в других районах города, но только по одному на район. И в отличие от Саратова, где во всех районах "метились" в одинаковый процент, в Тюмени в каждом районе была своя цель - где-то 48,4%, где-то 49-50%. Но всегда около 50%, чуть ниже
(3) башкирский Стерлитамак - рекордсмен среди ТИКов по количеству совпадающих участков: 97 из 116. Город отличается второй раз подряд - в 2011 г. там на большинстве участков была явка 75% и за ЕР 75%. Теперь все скромнее - только 55%. Высвободившиеся проценты не стали распылять по разным партиям или оставлять на усмотрение избирателям - а записали КПРФ, у которой на 85 участках из 97 результат составил фантастические 31% плюс-минус 0,5%. Подробнее у kireev
(4) Уфа. Аналог Тюмени - "сгусток" в каждом или почти каждой районе, у каждого района своя "цель", но это всегда число около 50% (47-48% в Кировском районе до 51% в Демском). Особо примечателен Орджоникидзевский район, где 15 участков не просто совпали в узком диапазоне шириной 0,2%, но еще и диапазон этот оказался ровно на 50%. Похожая на Уфу картина - только чуть более высокие проценты за ЕР - и в башкирских "сгустках" за пределами Уфы (например, в Салавате и Октябрьском)
(5) Саратов. Тут нужны пояснения. Во-первых, использованный мною алгоритм ищет "сгустки" в пределах ТИКа, а не города. Поэтому 107 саратовских участков с попаданием в 62,2% в таблице показаны 5 отдельными строчками. Во-вторых, алгоритм заточен под обнаружение максимально больших "сгустков" с аномально большой плотностью распределения. Поэтому если в диапазоне шириной скажем 2% обнаруживается аномально много участков, то дальнейший анализ будет вестись по этому диапазону - а не по более узкому (и менее вероятному), но включающему в себя меньшее количество участков диапазону в 1% или меньше. Соответственно, указанные в таблице границы диапазонов для районов Саратова шире, чем реальная ширина "сгустка" (которая составляет 0,11% - 62,135% до 62,245%)

Как считается вероятность случайного совпадения?
Шаг 1. Если представить голосование на каждом участке как биномиальное распределение, то у нас есть матожидание - средний результат ЕР по группе участков с похожими результатами и есть количество "испытаний" (количество проголосовавших). Далее по формуле биномиального распределения считаем вероятность, что количество "успехов" (голоса за ЕР) попадет в искомый интервал [все считается в экселе через формулу биномиального распределения - БИНОМРАСП]. По сути мы считаем, что доля голосов за ЕР в "выборке" (на конкретном участке) будет отличаться от доли голосов за ЕР в "генсовокупности" (все совпадающие участки) не более чем на 1/2 ширины диапазона

Шаг 2. После того, как мы посчитали вероятность попадания результат ЕР на отдельном участке в определенный диапазон (у каждого участка эта вероятность будет своя, можно взять среднюю по всей группе совпадающих участков), мы можем посчитать вероятность того, что в целом по ТИКу из m участков n участков попадет в искомый диапазон

ВАЖНО: моя оценка строится на допущении, что отклонения результатов голосования по участкам носят случайный характер (как будто избирательный участок - это случайная выборка из генеральной совокупности). Это предположение пусть и не соответствует действительности, но оно максимально лояльно к избиркомам и дает самую высокую оценку вероятности попадания результата в одно и то же значение. Любая модель, включающая учет социально-демографических и экономических различий между участками, покажет большую дисперсию результатов и еще меньшую вероятность кучкования результатов вокруг одного числа

Непосредственно поиск "сгустков" осуществлялся путем подсчета для каждого участка количества других участков в том же ТИКе, которые по результату Единой России отстают от него не более чем на 2%, на 1%, на 0,5%, на 0,2% или 0,1% (для каждого размера шага делались свои подсчеты). Далее для каждого совпадения нескольких участков ТИКа в одном диапазоне считалась вероятность того, что это получилось случайно. Если в одном ТИКе получалось несколько наборов участков с вероятностью совпадения менее 0,01%, то выбирался диапазон, включающий наибольшее количество участков. Далее проводился повторный (финальный) подсчет вероятности случайного совпадения - исходя не из стандартной, а из фактической ширины диапазоны. В ряде случаев из выявленных скоплений участков вручную исключались УИКи, которые формально попадают в тот же диапазон - но по проценту за ЕР сильно отстают от основной масся участков внутри диапазона 


Володинские 62,2% в Саратове: математическое доказательство фальсификации для чайников
barouh

Последние дни много веселья про результаты выборов в Саратове, где более чем на четверти участков результат Единой России оказался ровно 62,2% с точностью плюс-минус несколько сотых процента. Вот тут наглядно. Особой пикантности придает тот факт, что в Думу от Саратовской области баллотировался Володин - зампред президентской администрации, куратор всех выборов и будущий спикер Госдумы

На уровне базовой вменяемости понятно, что не может быть такое совпадение результатов на десятках участков. Но люди просят ДОКАЗАТЕЛЬСТВ. Ну что же, объясняю на пальцах и с цифрами. Математическое доказательство того, что результаты выборов по Саратову фальсифицированы

Для начала представьте себе огромный контейнер, в котором много-много (больше 100 тысяч) шаров. Белые и черные. Черных больше - 62,2% от всех. Шары равномерно и добросовестно перемешаны - т.е. в любой части контейнера соотношение белых и черных шаров примерно одинаковое
Теперь мы вслепую достаем шары из этого контейнера и раскладываем по кучкам. Пусть в каждой кучке у нас будет 1340 шаров. Сколько в каждой кучке будет черных шаров? Можем ли мы быть уверены, что в каждой кучке доля черных шаров будет именно 62,2%, а не скажем 62,0%, 62,4% или 65,0%? Тут нам на помощь приходит математика биномиального распределения. Биномиальное распределение - это такое случайное распределение, у которого может быть только два значения (0 или 1, "да" или "нет") и у которого есть определенная вероятность, что случится исход "да". Вокруг этого построен большой и важный раздел теории вероятности, и здесь используется четкая и легко доказуемая математика
Прежде чем с помощью тервера отвечать на условно сложный вопрос про 1340 шаров, давайте посмотрим на простую ситуацию - вытаскиваем 2 шарика. У нас может быть всего 4 комбинации: черный-черный, черный-белый, белый-черный, белый-белый. Вероятность, что будет 2 белых шара, примерно 15% (37,8% в квадрате), вероятность, что будет 2 черных шара, чуть меньше 40% (62,2% в квадрате). Остальные примерно 45% - это вероятность того, что будет 1 белый шар и 1 черный шар (нам не важно, в каком порядке мы их вытащим). Если у нас 3 шарика, то комбинаций уже 8, вероятность 3 белых шаров около 6%, вероятность 3 черных шаров около 35%, а скорее всего у нас будет 1 или 2 черных шара. Ну и так далее.
Есть понятные и достаточно легко выводимые формулы (вот например не очень заумное описание), есть функция в Excel под названием BINOMDIST (БИНОМРАСП), которая позволяет рассчитать вероятность для любого количества успешных исходов при определенном количество "попыток" (в нашем примере это вытаскиваемые шары) и определенной вероятности.
Например, если мы вытащили 1340 шариков из большого контейнера, в котором доля черных шаров составляет 62,2%, то вероятность, что в кучке окажется менее 60% черных шаров составляет 5,2%, а что более 65% - 1,8%. Менее 62% получится с вероятностью 43%, более 63% - с вероятностью 29% (и соответственно только 28% исходов придется на диапазон от 62% до 63%). Вероятность же того, что при округлении до десятых процента у нас получится ровно 62,2%, совсем небольшая - такой результат получится только если черных шаров будет 833 или 834, а вероятность любого из этих исходов составляет примерно 2,2% (4,5% в сумме). То есть только в каждой 22-ой кучке у нас доля черных шаров (округленная до десятых долей процента) будет такой же, как во всем контейнере - в остальных кучках она будет немного (на десятые доли процента или на несколько процентов) больше или меньше; в половине случаев отклонение будет 1% или более.

А теперь вместо шаров подставим избирателей. Кучки = избирательные участки, 1340 = среднее количество избирателей, проголосовавших на саратовских участках; 62,2% = результат Единой России на сомнительных участках; контейнер = все саратовские участки, где повторяется результат 62,2% (а точнее от 62,135% до 62,245%). Здесь мы на самом деле делаем два важных допущения В ПОЛЬЗУ предположения о честности саратовских избиркомов: во-первых, мы допускаем, что за Единую Россию в сумме по обсуждаемым участкам действительно проголосовало 62,2% избирателей (т.е. что в "контейнере" доля черных шаров действительно 62,2%); во-вторых, мы допускаем, что участки одинаковые по характеристикам избирателей, т.е. что белые и черные "шары" хорошо перемешаны и отличия между "кучками" по доле черных шаров случайны. На самом деле оба допущения конечно же не соответствуют действительности, но нам важно доказать, что даже при максимально лояльных к избиркомам допущениям полученные в Саратове результаты статистически невероятны (если мы предположим, что на самом деле вероятность голосования за Единую Россию в целом по городу не 62,2%, а меньше или больше, или если мы предположим, что между отдельными избирательными участками есть фундаментальные различия по составу электората, наша оценка вероятности попадания результата ЕР на конкретном участке в 62,2%, а точнее в диапазон 62,135%-62,245%, резко упадет). Вероятность (попадания точно в 62,2%) на уровне 4,5%, которая у нас посчиталась выше, - это максимально возможная, максимально лояльная к избиркомам оценка.
Итак, если в городе (районе, группе избирательных участков) за Единую Россию в среднем голосует 62,2%, то на участке с 1340 избирателями вероятность попадания результата (с точностью до десятых процента) в 62,2% составляет 4,5%. А вот на участке с 1341 избирателями вероятность такого попадания уже составляет всего лишь 2,2% - потому что в искомый диапазон попадает уже не 2 числа (833 и 834), а только одно (834). Если взять официальные данные по количеству проголосовавших по каждому из 107 прославившихся участков (а там по официальным цифрам голосовало от 550 до 1922 человек на каждом участке), то в среднем по этим участкам вероятность попадания результата ЕР в диапазон от 62,135% до 62,245% составляет 3,4% (разброс от 1,9% до 5,3%)

На картинке показано распределение саратовских участков по явке - с группировкой по "бинам" шириной в 0,1%. И для сравнения синенький холмик - распределение, которое должно было получиться, если бы все участки Саратова были бы примерно одинаковые, и различия между ними носили случайный характер (в реальности, с учетом экономических и социальных различий между районами города, "холмик" должен был бы быть еще более низким и широким)



Выше мы посчитали по отдельным участкам. А чтобы от этого перейти к оценке вероятности в целом по Саратову, мы смоделируем еще одно биномиальное распределение. В первом распределении у нас исходом было голосование или неголосование конкретного избирателя за Единую Россию. Во втором распределении таким исходом уже является попадание или непопадание результата ЕР на конкретном участке в 62,2%. Участков в Саратове 346, из них на 107 участках результат Единой России составил от 62,136% до 62,245%, вероятность попадания участка в этот диапазон в среднем 3,4%. При такой вероятности подобных участков должно было бы быть в Саратове около 12. А их оказалось 107! 95 сверхнормативных попаданий. Эксель даже не может посчитать вероятность такого "везения" - в какой-то момент он округляет до нуля. Но эксель может посчитать, что вероятность 10 и более попаданий сверх нормы (22 УИКа и более) составляет 0,4%, вероятность 20 попаданий сверх нормы уже в 9300 раз меньше - только 0,000045% (1 раз на 2,2 миллиона голосований). Максимум, что может посчитать эксель - 46 попаданий из 346: вероятность 1 на 180 триллионов. Дальше можно только примерно оценивать - для 107 попаданий у меня получилась вероятность примерно 10 в степени -44. Примерно как если бы в рулетке одно и то же число выпало 28 раз подряд. Вот у единоросов в Саратове точно такая же феноменальная стабильность и везение

Еще раз: вероятность того, что популярность в Саратове результата ЕР 62,2% получилась случайно (а не в результате рисования цифр) составляет не более 10-44

А вещь еще в Саратове было 35 участков, где результат Единой России чуть больше 62,2% - от 62,25% до 62,40%. Таких 35 участков. Вероятность, что эти 35 участков скучковались случайно, - 0,0001% или 1 случай на 945 тысяч. Так что математически фальсификации в Саратове доказываются даже не на 107 участках, а как минимум на 142 участках - это почти половина города.

P.S. Спасибо заинтересованному читателю, который не поленился продублировать мои расчеты. Похоже, что я сильно завысил вероятность саратовского совпадения. Для 107 участков вероятность совпадения получается не 10-44, а видимо что-то около 10-70 или 10-80

</sup>


кандидаты Парнаса: рейтинг популярности
barouh
В продолжение темы - рейтинг кандидатов Парнаса по объему поискового спроса. Про методику подробно написано в предыдущей записи - которая про яблочных кандидатов

В сумме у кандидатов Парнаса в 2 раза меньше запросов, чем у кандидатов Яблока. И как и в случае с Яблоком, тут тоже есть кандидат, запросы по которому задают чаще, чем в сумме по всем другим кандидатам партии. Это Андрей Зубов, баллотирующийся по Центральному округу №208. По нему было задано за месяц более 3300 запросов (это уже с корректировкой на вычет фонового среднероссийского уровня поискового интереса), а у остальных "парнасовцев" в сумме менее 2900 запросов.

Если у Яблока 6 кандидатов с более-менее заметным объемом поискового спроса, то у Парнаса только трое - помимо Зубова, также Николай Ляскин (Бабушкинский округ №196) и Константин (Константинас) Янкаускас (Черемушкинский округ №209). У остальных "парнасовцев" - фоновые 100-200 запросов в месяц у каждого из кандидатов.

Дополнение: у Парнаса есть еще один успешный кандидатов в Московской области - Андрей Шальнев. На графике ниже он не показан, потому что он в области, а не в городе, но по количеству запросов - около 500 за месяц - он сопоставим с Янкаускасом, а в своем округе уступает только единоросу. Остальные кандидаты Парнаса и Яблока в области хорошей статистикой поискового спроса похвастаться не могут

Что печально для сочувствующих избирателей - и Зубов, и Ляскин, и Янкаускас идут по округам, в которых кроме них есть и второй кандидат от непарламентской демократической оппозиции с заметной кампанией (это соответственно Баронова, Митрохин и Русакова). При этом в большинстве округов Москвы (округа 197, 199, все с 202 по 205, 207, 210) и у Яблока, и у Парнаса кандидаты с нулевой или по крайней мере незаметной для избирателей кампанией.


Яблочные кандидаты в Москве: кто из них заметнее для избирателей?
barouh
Я померял популярность кандидатов в одномандатных округах Москвы. Для затравки - сравнение популярности кандидатов от Яблока.

технические подробностиCollapse )
Итак, кандидаты Яблока. Вне конкуренции (ожидаемо) - Дмитрий Гудков, Тушинский округ №206. За месяц про него задали в Яндексе более 6800 запросов (здесь и далее все цифры по количеству запросов - с описанной выше поправкой на исключение фонового общероссийского уровня поискового интереса). 6800 запросов - это на треть больше, чем в сумме по всем остальным яблочным кандидатам. Справедливости ради надо отметить, что Тушинский округ наряду с Центральным вообще выделяется обилием поисковых запросов про кандидатов - если в других округах в сумме по всем кандидатам получается от 2,5 до 7 тысяч запросов на округ, то в Центральном 16 тысяч, а в Тушинском 19,5 тысяч. В общегородском топ-5 кандидатов по объему поискового спроса - исключительно кандидаты из Центрального (Баронова и Зубов) и Тушинского (кроме Гудкова, это еще Коротченко и Онищенко) округов.

Ну а кто из Яблока кроме Гудкова? На втором месте (если смотреть только на округа в Москве) Кирилл Гончаров из Нагатинского округа №201. Гончаров (он совсем молодой - 1992 года рождения) отличился уже в 2014 году на выборах в МГД, когда занял в округе второе место (24%) и показал один из лучших среди всех яблочных кандидатов результат. Сейчас он похоже проводит еще более мощную кампанию, и видимо в своем округе он - единственный реальный конкурент единоросски Паниной. Далее более предсказуемо - на третьем месте Юлия Галямина (Ленинградский округ №198), следом самый статусный из яблочных кандидатов Сергей Митрохин (Бабушкинский округ №196), "системный" правозащитник Андрей Бабушкин (Медведковский округ №200) и, с большим отставанием от них, Елена Русакова (Черемушкинский округ №209). У яблочных кандидатов во всех остальных округах от 75 до 250 запросов в месяц на каждого - это такой фоновый результат, который говорит о практически нулевой кампании и близком к нулевому отклике избирателей.

Помимо Гудкова и Гончарова, которые по количеству поисковых запросов лидеры в своих округах, еще только Галямина попадает в своем округе в первую тройку. Остальные яблочные кандидаты - на местах с 4-го по 6-е или в отдельных случаях даже ниже.

График вот. Чтобы остальные кандидаты не сливались с горизонтальной осью, пришлось Гудкова "обрезать" меньше чем на одной трети. А про другие партии тоже будет - но чуть позже


самый теплый день рождения
barouh

предыдущий рекорд от 1982 года (мой последний дошкольный год :) был превзойден уже в 6 утра

http://www.interfax.ru/moscow/486579


Как активный гражданин, напишу про "Активного гражданина"
barouh

(кросспост в ФБ - https://www.facebook.com/notes/boris-ovchinnikov/про-активного-гражданина/10153191256792304)

Попробовал собрать воедино информацию и аргументацию относительно реальной посещаемости проекта «Активный Гражданин». Внимание к цифрам это проекта в начале недели было привлечено удивительно высокими цифрами количества проголосовавших по вопросу о переименовании станции метро Войковская (http://ag.mos.ru/poll/view/1428)
Итак, что мы знаем:

что мы знаемCollapse )
В качестве интермедии я бы хотел выразить искреннюю и без всякого сарказма благодарность твиттер-аккаунту московского IT-департамента (https://twitter.com/emoskva). Представленные скриншоты и пояснения не снимают многих вопросов, но по крайней мере делают дискуссию предметной

А теперь о том, почему все равно трудно поверить в цифры, заявляемые в рамках проекта Активный гражданин
мои сомненияCollapse )

К сожалению, ситуация патовая – я не верю, что ДИТ пойдет на раскрытие информации по голосованию (включая как собственные статистические данные проекта, так и данные внешних измерений вроде Яндекс.Метрики) в том объеме, который способен снять подозрения в фальсификации. Отдельные скриншоты не могут быть убедительным доказательством чистоты статистики. Активный гражданин остается «черным ящиком», основные метрики которого – в первую очередь количество проголосовавших – невозможно проверить извне.
При этом речь же идет не только о том, действительно ли у Активного гражданина так много голосующих пользователей. Если есть основания (а они к сожалению есть) предполагать, что фальсифицировано количество поданных голосов, то это автоматом означает, что и результаты голосования могут фальсифицироваться – притом практически в неограниченном масштабе

Дно недостижимо
barouh

(кросспост из ФБ - поскольку это напрямую касается ЖЖешечки)

За "создание уникальных сюжетов, рубрик, новых форматов блогерского контента" в качестве продюсера Живого Журнала теперь отвечает Тимофей Шевяков. В ЖЖ известный как tarlith_history. Активный сподвижник "хакера Хелла", недавно осужденного в Германии за свои хакерские подвиги. Ну это примерно как если бы Энтео стал замдиректора Эрмитажа. Подробно про Тарлита тут:
http://www.anticompromat.org/raznoe/shevyakbio.html

Новость о назначении:
https://roem.ru/27-08-2015/204414/pryanikov-shevyakov-jj/


Дискриминация иноверцев в Москве: рост за 100 лет то ли в 4, то ли в 14 раз
barouh

Не удержусь и поразжигаю. Копий на тему того, нужно ли строить в Москве новые храмы, а тем более новые мечети, сломано уже много. Но любопытно посмотреть на вопрос в исторической так сказать ретроспективе

Итак, чуть больше 100 лет назад. Православная империя. В Москве около 1.4 миллиона жителей, из которых только 1% (14 тысяч) - мусульмане [1]. Подавляющее большинство населения города - православные (хотя еще были десятки тысяч староверов, и заметное количество протестантов и католиков). По данным из Брокгауза и Ефрона на 1902 год, в городе (в границах того времени!) было 443 действующих храма - примерно по 1 храму на 3 тысячи православных [2]

Мечетей было две - в Татарской слободе и в Марьиной Роще. Вторую мечеть - у нынешнего Олимпийского - построили в самом начале 20 века: хотя мусульман в Москве было еще немного, власти нехотя, но все же признали, что мечети в Замоскворечье недостаточно и дали разрешение на строительство второй. Так что получалось по 7 тысяч мусульман на одну мечеть - это примерно в 2,5 раза больше, чем аналогичный показатель для православных. Разница большая, но ожидаемая и наверное приемлемая для страны, в которой православие было официальной религией, и для города, большинство населения которого с основания составляли православные

Прошло 100 лет. Население города выросло почти на порядок - по официальным данным, до 12 миллионов. Статистики по конфессиям нет, но можно попытаться сделать примерные оценки. Вот например в исследовании "Арена. Атлас  религий", проведенном фондом Среда в 2012 году [3], 53% опрошенных москвичей заявили о себе как о православных. Если наложить эту цифру на население, то получится 6,5 миллионов человек. Церквей в Москве на конец 2012 года было 894 [4]. Правда, только около половины из них постоянно действующие, т.е. с регулярными службами и с прихожанами, - но и статистика 1902 года вероятно учитывает не только приходские церкви. 6500000/894 - это чуть больше 7 тысяч человек на один храм

С долей мусульман сложнее. Тот же проект Арена дал результат, что только 3% населения столицы - это мусульмане. В абсолютных цифрах это получается менее 400 тысяч человек. Но это явно заниженная оценка - традиционные методы опроса видимо плохо "вылавливают" этнические и религиозные меньшинства. Даже по данным переписи 2010 г. (для Москвы - сильно кривой и видимо приукрашенной), в Москве проживало около 350 тысяч представителей мусульманских народов (татары, азербайджанцы, узбеки и т.д.).

Альтернативную оценку можно сделать исходя из доли Москвы в мусульманском населении России. Судя по статистике поисковых запросов "намаз" или "байрам" [5], в Москве и области проживает почти 30% от всех мусульман в России, пользующихся интернетом. С поправкой на несколько большее проникновение интернета в Москве, чем в целом по России, это означает, что на Москву и область приходится примерно 20% мусульман, постоянно или временно проживающих в России. Из них собственно на Москву приходится вероятно около половины - т.е. ~10% от общероссийских цифр. По тому же исследованию Арена, в целом по России мусульман - 7%, 10 миллионов человек. Но как мы видим на примере Москвы, цифры Среды занижены. Альтернативная оценка исходя из данных переписи о том, что суммарная численность "мусульманских" народов России - около 15 млн человек, и из данных ФМС о пребывании в России почти 5 млн человек из преимущественно мусульманских стран, мы получаем оценку в 20 миллионов "этнических мусульман". Не все из них идентифицируют себя как верующие - а предположительно только 70-80%. Получается 15 миллионов мусульман, из которых десятая часть - т.к. примерно 1,5 миллиона - живет в Москве

Далее. Насколько мне удалось выяснить, в Москве 6 официальных мечетей (из них две шиитские). Даже если исходить из явно заниженной оценки в менее чем 400 тысяч мусульман, получается примерно по 65 тысяч человек на одну мечеть. Если же исходить из оценки в 1,5 миллиона, то это уже 250 тысяч человек на одну мечеть. Даже если исходить из официальных данных по национальному составу населения Москвы (

Получается, что по сравнению с началом 20 века, обеспеченность православного населения Москвы храмами снизилась примерно в 2,5 раза, а обеспеченность мусульманского населения - в 10-35 раз. "Коэффициент дискриминации" мусульманского населения с 2,5 вырос то ли до 9, то ли до 35

Спрашивается - исходя из этих цифр, храмы какой религии надо строить в Москве в первую очередь? Ну хотя бы для того, чтобы по уровню уважения прав "иноверцев" вернуться к показателям столетней давности

1907 2013
Православная империя Светская федеративная республика
Население Москвы, млн
(официально)
~1,4 12
Мусульман, млн 0,014 ~0,4 / 1,5
Православных (РПЦ), млн ~1,25 6,5
Мечетей 2 6
Православных храмов 443 (на 1902 г.) 894
Верующих на 1 мечеть, тыс 7 65 / 250
Верующих на 1 храм, тыс 3 7
Коэффициент дискриминации 2,5 9 / 35

P.S. С чего это я обратился к этой теме? Особого повода нет. Просто у меня есть список всяких статистических интересностей, про которые стоило бы написать. Вот добрался до одного из пунктов списка

[1] http://CyberLeninka.ru/article/n/musulmanskaya-obschina-moskvy-vo-vtoroy-polovine-xix-nachale-xx-veka.pdf
[2] https://slovari.yandex.ru/~книги/Брокгауз и Ефрон/Москва/
[3] http://sreda.org/arena

[4] http://eparchia.patriarchia.ru/db/text/3004275.html
[5] https://wordstat.yandex.ru/#!/regions?words=намаз + https://wordstat.yandex.ru/#!/regions?words=байрам


продолжение сериала "Вы будете смеяться"
barouh

(предыдущие серии: Луганск и Сирия)


Originally posted by kireev at О нарисованных результатах выборов в ДНР

Вы будете смеяться, но результаты выборов в ДНР были нарисованы. Итак, вот результаты выборов, опубликованные на официальном сайте Правительства и Верховного Совета ДНР:

Захарченко 765 340
Кофман 111 024
Сивоконенко 93 280

В сумме 969 644 голоса.  Теперь вычисляем проценты:

Захарченко 78,93000%
Кофман 11,4500%
Сивоконенко 9,6200%

Опять же сотые доли процента попадают с точностью до человека, как и в ЛНР на майском референдуме: сначала рисовали проценты, а ПОТОМ уже из них вычисляли абсолютные цифры. А когда считают голоса, а не рисуют результаты, должно быть наоборот. В ЛНР уже ошибку поняли и теперь на этом не попались, зато теперь попались в ДНР.

Число недействительных было 43039, тогда сумма проголосовавших (действительные плюс недействительные) составила 1012683. Вычисляем процент недействительных от этого числа и получаем 4,25000%!

Кстати, на официальном сайте Правительства и Верховного Совета ДНР проценты за кандидатов указаны другие и они не совпадают с абсолютными цифрами в протоколе!!! Вот их проценты в тексте сообщения: Захарченко 77,51%, Кофман 10,03%, Сивоконенко 8,21%. Если считать от суммы голосов за кандидатов, то проценты будут те, которые я указал выше. А если считать от суммы голосов за кандидатов и недействительных бюллетеней, то проценты тоже получаются другие: Захарченко 75,58%, Кофман 10,96%, Сивоконенко 9,21% и недействительные 4,25% Даже пропорции голосов за кандидатов у них другие, чем в их же протоколе ниже этого сообщения!!!

Итак, что мы имеем. Количество участков сократили в несколько раз, искусственно создав таким образом очереди на участках. Подержав пару часов бабулек на холоде и сделав необходимые фотографии для СМИ, они просто нарисовали результаты выборов. А бабульки на холоде стояли зря: их голоса не были учтены, потому что сначала вычислялись проценты, а уж потом под них вычислили абсолютные цифры.


?

Log in