?

Log in

No account? Create an account

Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Entries by category: россия

Невероятные совпадения: история вопроса
barouh

Уж коли зашла речь про невероятные совпадения, когда куча УИКов в одном районе или городе показывают одинаковые результаты, применительно к выборам 2016 года и 2011 года, то интересно посмотреть на эту тему в ретроспективе. Оказывается, kobak это посчитал еще 4 года назад - но все это время результаты пылились в почтовых ящиках и ни разу опубликованы не были. С разрешения автора исправляю

Итак, список ТИКов с аномально низкой для случайного распределения дисперсией (p<0,0001). Дисперсия считалась по половине участков каждого ТИКа - по тем участкам, на которых результат ЕР ближе к медиане. Соответственно, "сгустки", в которые попадает менее половины участков района, в этот список не вошли (поэтому в частности тут нет питерских совпадений 2012 года и есть некоторые несовпадения с моими списками)

Но тренд все равно хорошо видно: в 2000 еще таких однотипных рисовок результатов не было, в 2003 они появились и далее становились все более распространенными. Так, в 2008 они впервые появились за пределами республик - в Кемеровской области. Тренд казалось бы был переломлен в 2012 году, когда количество ТИКов с массовыми однотипными рисовками результатов сократилось в 3 раза.



Но как мы теперь знаем, это был не перелом тренда - а временное отступление. В 2016 году количество рисованных ТИКов выросло снова к уровням 2008 и 2011 годов или даже выше (прямое сопоставление - где больше - пока никем не сделано; я пишу о 50 ТИКах с аномальными "сгустками" в 2016 году, но я использую немного иную методику, и часть выявленных мною "сгустков" алгоритм Кобака не увидел бы)

список аномальных ТИКов по годамCollapse )


Чечня, Башкирия, Саратов, Тюмень: 51 ТИК, в которых фальсификация доказывается математически
barouh
Про саратовскую аномалию 62,2% и количественную оценку (не)вероятности тамошней кучности результатов Единой России я уже писал. Заодно я там рассказал про методику оценки того, что более чем на сотне участков доля голосов за ЕР случайным образом совпадет с точностью до десятой доли процента - это делается через два биномиальных распределения (краткий пересказ методики см. в конце данного поста). Но Саратов - лишь один из примеров. Всего удалось выявить 51 "сгусток" со статистически невероятной концентрацией результатов Единой России на том или ином проценте в пределах одного ТИКа (города, района, городского района).

Все эти 51 "сгусток" приходятся на 11 регионов - это Саратовская и Тюменская области (в обоих случаях - только районы областного центра), Кемеровская область, Ханты-Мансийский округ и республики - Дагестан, Чечня, Ингушетия, Кабардино-Балкария, Карачаево-Черкессия (т.е. все северокавказские, кроме Осетии и Адыгеи), а также Татарстан и Башкирия. Примечательно, что в большинстве из этих регионов - во всех, кроме ХМАО и КЧР - "сгустков" сразу несколько: не менее трех на регион.



Ниже в таблице перечислены все "сгустки", для которых вероятность их случайного образования составляет менее 0,006% (1 случай на 17 тысяч). Казалось бы, 0.006% - не такая уж и маленькая вероятность. Но: как сказано выше, в этих же регионах (за исключением ХМАО) встречаются и другие "сгустки" - уже с вероятностями менее 0,000005% (менее 1 случая на 20 миллионов). Получается, что концептуально между вероятностью 10-5 и скажем 10-12 нет никакой разницы - и те, и те "совпадения" возможны только в одних и тех же специфических регионах, и совпадение их географии - наглядное доказательство того, что "сгустки" с вероятностью 10-5 - это тоже фальсификации, прямые "рисовки" результатов.

В сумме на 51 "сгусток" приходится 1566 участков, на которых проголосовало почти 2 миллиона человек (1984 тысячи), из них 1417 тыс. за Единую Россию. То есть каждый 20-ый голос, полученный ЕР по стране, нарисован в этих "сгустках". И по хорошему результаты по всем этим участкам надо отменять. Или как минимум инициировать проверку ЦИКа - с привлечением к ней представителей партий и общественных организаций

Итак, таблица (полная версия)

ТИК диапазон кол-во и доля УИКов вероятность
Кабардино-Балкарская Республика
Прохладненская городская 78,35%-78,46% 20 УИКов (100%) 5,3E-27
Эльбрусская 78,43%-79,72% 21 УИКов (100%) 3,6E-10
Нальчикская городская 76,03%-77,97% 86 УИКов (84%) 2,3E-07
Карачаево-Черкесская Республика
Черкесская городская 76,41%-78,14% 51 УИКов (98%) 6,1E-12
Прикубанская 83,08%-83,71% 18 УИКов (78%) 3,3E-10
Кемеровская область
Полысаевская городская 72,45%-73,22% 20 УИКов (100%) 2,3E-14
Топкинская 80,57%-81,93% 34 УИКов (69%) 4,0E-08
Юргинская городская 80,48%-82,47% 40 УИКов (98%) 6,6E-07
Березовская городская 72,46%-73,41% 17 УИКов (68%) 4,0E-08
Анжеро-Судженская городская 72,16%-74,15% 45 УИКов (75%) 4,6E-05
Мысковская городская 71,76%-72,75% 18 УИКов (72%) 6,0E-05
Республика Башкортостан
Стерлитамакская городская 54,41%-56,4% 97 УИКов (84%) 2,1E-12
Октябрьская 52,74%-53,68% 30 УИКов (73%) 4,5E-10
Салаватская городская 50,99%-51,05% 12 УИКов (19%) 1,2E-08
Уфа, Калининская 47,54%-49,04% 52 УИКов (76%) 1,1E-07
Уфа, Кировская 46,21%-48,16% 56 УИКов (74%) 3,5E-06
Уфа, Орджоникидзевская 49,92%-50,1% 15 УИКов (23%) 4,3E-06
Стерлибашевская 61,73%-62,71% 16 УИКов (48%) 6,6E-06
Уфа, Демская 50,96%-51,42% 14 УИКов (42%) 1,0E-05
Республика Дагестан
Дахадаевская 91,07%-92,45% 42 УИКов (75%) 2,6E-08
Сулейман-Стальская 89,85%-90,35% 23 УИКов (55%) 1,9E-07
Сергокалинская 95,89%-96,06% 13 УИКов (45%) 3,1E-07
Республика Ингушетия
Назрановская 70,24%-71,05% 23 УИКов (79%) 7,4E-09
Малгобекская городская 72,34%-73,7% 19 УИКов (90%) 5,3E-07
Сунженская 73,93%-74,1% 10 УИКов (38%) 1,6E-06
Республика Татарстан (Татарстан)
Зеленодольская городская 79,97%-80,14% 15 УИКов (39%) 4,3E-08
Нурлатская 98,97%-99,84% 43 УИКов (98%) 9,0E-07
Набережные Челны, Комсомольская 79,54%-80% 23 УИКов (49%) 3,5E-06
Лениногорская городская 86,93%-87,12% 11 УИКов (46%) 6,4E-06
Елабужская городская 84,78%-86,01% 31 УИКов (79%) 8,3E-06
Казань, Приволжская 74,82%-75,32% 30 УИКов (34%) 2,2E-05
Казань, Советская 74,04%-76,04% 78 УИКов (75%) 4,7E-05
Саратовская область
Саратов, Заводская 61,69%-62,82% 54 УИКов (76%) 5,5E-13
Саратов, Кировская 62,14%-62,29% 17 УИКов (27%) 2,8E-09
Саратов, Октябрьская 61,99%-62,81% 30 УИКов (56%) 2,5E-07
Саратов, Ленинская 61,48%-63,46% 83 УИКов (73%) 2,6E-06
Саратов, Фрунзенская 62,14%-62,34% 9 УИКов (36%) 1,0E-05
Тюменская область
Тюмень, Центральная 47,72%-47,96% 26 УИКов (36%) 2,1E-09
Тюмень, Центральная 38,21%-38,66% 30 УИКов (41%) 2,1E-09
Тюмень, Восточная 48,9%-50,13% 41 УИКов (71%) 2,1E-07
Тюмень, Ленинская 48,37%-48,46% 10 УИКов (22%) 1,2E-06
Тюмень, Калининская 48,96%-49,44% 28 УИКов (35%) 1,7E-06
Ханты-Мансийский автономный округ – Югра
Нефтеюганская 91,95%-92,03% 9 УИКов (36%) 2,8E-06
Чеченская Республика
Урус-Мартановская 97,37%-97,66% 36 УИКов (100%) 1,7E-19
Шалинская 95,42%-95,66% 27 УИКов (100%) 1,2E-19
Ножай-Юртовская 95,7%-96,21% 32 УИКов (100%) 1,8E-18
Гудермесская 97,53%-97,91% 45 УИКов (96%) 3,2E-16
Наурская 96,35%-96,55% 19 УИКов (100%) 9,7E-15
Грозный, Заводская 95,19%-95,39% 15 УИКов (100%) 1,7E-12
Шелковская 95,6%-96,17% 26 УИКов (100%) 4,7E-12
Сунженская 93,52%-93,72% 6 УИКов (86%) 2,9E-05

Примечательно, что за пределами вышеперечисленных 11 регионов случилось только два совпадения, вероятность которых получается меньше 0,1% - в одном из районов Челябинска 8 участков попали в диапазон от 31,79% до 31,88% за Единую Россию (вероятность такого совпадения в 4 раза выше, чем у замыкающего приведенную ниже таблицу "сгустка" в городе Мыски) , а в Большемурашкинском районе Нижегородской области сразу 9 участков (из 19) показали результат ЕР от 65,00% до 65,50% - но последний случай это как раз тоже явная фальсификация.

Про некоторые из "сгустков", попавших в таблицу выше, хочется сказать подробнее

(1) Город Прохладный в Кабардино-Балкарии. Безусловный рекордсмен, где все 20 участков уложились в диапазон от 78,35% до 78,46% за Единую Россию (не спрашивайте меня, почему именно 78,4% - не знаю). Там еще и явка почти совпадает (разброс от 88,6% до 90,3%), и проценты за другие партии (например, у КПРФ везде 18,8%, и только на одном участке 1 лишний голос - так что получилось 18,9%; у "эсеров" 2,0% плюс минус 0,1%; на четвертом месте везде "зеленые" везде с 0,3%; у Яблока ни одного голоса во всем городе; также в городе ни одного недействительного и ни одного попутавшего КПРФ и КПКР)
(2) Центральный район Тюмени. Это единственный ТИК, в котором обнаружилось сразу два "сгустка". Но примечательно даже не это, а то, какие именно проценты там рисовались. Более трети участков (36%) попали по голосованию за ЕР в диапазон чуть шире 0,2% - от 47,72% до 47,96%. Рисовали менее 48% - тогда как в большинстве других "сгустков" у Единой России 70% и более. Но это еще не все: в том же Центральном районе еще 30 участков (41% от всех УИКов района) показали результат за ЕР между 38% и 39% - что как раз примерно соответствует среднему результату ЕР по нефальсифицированным участкам в крупных городах. Притом в сытой, осыпанной нефтяными деньгами Тюмени даже в центре города поддержка Единой России должна быть выше среднего - так что похоже, что на части участков в Центральном районе Тюмени ЕР нарисовали процент меньше реального (впрочем, при рисованной явке около 75-80% ЕР все равно осталась в выигрыше по количеству полученных голосов). При 38,х% за Единую Россию совпадают и результаты других партий - у эсеров всегда 22% с копейками, у КПРФ 21%, у ЛДПР 17%, у остальных не более 0,2%.
Замечательная иллюстрация рисования результатов - участок 2220. Там при вводе данных промахнулись, и у КПРФ и эсеров оказалось по 0 голосов, тогда как их стандартные результаты - 21% и 22% - сместились на одну строчку вверх и оказались записаны соответственно на Яблоко и Патриотов России. Понятно, что это просто ошибка при вводе данных - но показательно, что подобные ошибки встречаются только там, где рисовали результаты.
В завершение темы Тюмени - "сгустки" есть и в других районах города, но только по одному на район. И в отличие от Саратова, где во всех районах "метились" в одинаковый процент, в Тюмени в каждом районе была своя цель - где-то 48,4%, где-то 49-50%. Но всегда около 50%, чуть ниже
(3) башкирский Стерлитамак - рекордсмен среди ТИКов по количеству совпадающих участков: 97 из 116. Город отличается второй раз подряд - в 2011 г. там на большинстве участков была явка 75% и за ЕР 75%. Теперь все скромнее - только 55%. Высвободившиеся проценты не стали распылять по разным партиям или оставлять на усмотрение избирателям - а записали КПРФ, у которой на 85 участках из 97 результат составил фантастические 31% плюс-минус 0,5%. Подробнее у kireev
(4) Уфа. Аналог Тюмени - "сгусток" в каждом или почти каждой районе, у каждого района своя "цель", но это всегда число около 50% (47-48% в Кировском районе до 51% в Демском). Особо примечателен Орджоникидзевский район, где 15 участков не просто совпали в узком диапазоне шириной 0,2%, но еще и диапазон этот оказался ровно на 50%. Похожая на Уфу картина - только чуть более высокие проценты за ЕР - и в башкирских "сгустках" за пределами Уфы (например, в Салавате и Октябрьском)
(5) Саратов. Тут нужны пояснения. Во-первых, использованный мною алгоритм ищет "сгустки" в пределах ТИКа, а не города. Поэтому 107 саратовских участков с попаданием в 62,2% в таблице показаны 5 отдельными строчками. Во-вторых, алгоритм заточен под обнаружение максимально больших "сгустков" с аномально большой плотностью распределения. Поэтому если в диапазоне шириной скажем 2% обнаруживается аномально много участков, то дальнейший анализ будет вестись по этому диапазону - а не по более узкому (и менее вероятному), но включающему в себя меньшее количество участков диапазону в 1% или меньше. Соответственно, указанные в таблице границы диапазонов для районов Саратова шире, чем реальная ширина "сгустка" (которая составляет 0,11% - 62,135% до 62,245%)

Как считается вероятность случайного совпадения?
Шаг 1. Если представить голосование на каждом участке как биномиальное распределение, то у нас есть матожидание - средний результат ЕР по группе участков с похожими результатами и есть количество "испытаний" (количество проголосовавших). Далее по формуле биномиального распределения считаем вероятность, что количество "успехов" (голоса за ЕР) попадет в искомый интервал [все считается в экселе через формулу биномиального распределения - БИНОМРАСП]. По сути мы считаем, что доля голосов за ЕР в "выборке" (на конкретном участке) будет отличаться от доли голосов за ЕР в "генсовокупности" (все совпадающие участки) не более чем на 1/2 ширины диапазона

Шаг 2. После того, как мы посчитали вероятность попадания результат ЕР на отдельном участке в определенный диапазон (у каждого участка эта вероятность будет своя, можно взять среднюю по всей группе совпадающих участков), мы можем посчитать вероятность того, что в целом по ТИКу из m участков n участков попадет в искомый диапазон

ВАЖНО: моя оценка строится на допущении, что отклонения результатов голосования по участкам носят случайный характер (как будто избирательный участок - это случайная выборка из генеральной совокупности). Это предположение пусть и не соответствует действительности, но оно максимально лояльно к избиркомам и дает самую высокую оценку вероятности попадания результата в одно и то же значение. Любая модель, включающая учет социально-демографических и экономических различий между участками, покажет большую дисперсию результатов и еще меньшую вероятность кучкования результатов вокруг одного числа

Непосредственно поиск "сгустков" осуществлялся путем подсчета для каждого участка количества других участков в том же ТИКе, которые по результату Единой России отстают от него не более чем на 2%, на 1%, на 0,5%, на 0,2% или 0,1% (для каждого размера шага делались свои подсчеты). Далее для каждого совпадения нескольких участков ТИКа в одном диапазоне считалась вероятность того, что это получилось случайно. Если в одном ТИКе получалось несколько наборов участков с вероятностью совпадения менее 0,01%, то выбирался диапазон, включающий наибольшее количество участков. Далее проводился повторный (финальный) подсчет вероятности случайного совпадения - исходя не из стандартной, а из фактической ширины диапазоны. В ряде случаев из выявленных скоплений участков вручную исключались УИКи, которые формально попадают в тот же диапазон - но по проценту за ЕР сильно отстают от основной масся участков внутри диапазона 


Яблочные кандидаты в Москве: кто из них заметнее для избирателей?
barouh
Я померял популярность кандидатов в одномандатных округах Москвы. Для затравки - сравнение популярности кандидатов от Яблока.

технические подробностиCollapse )
Итак, кандидаты Яблока. Вне конкуренции (ожидаемо) - Дмитрий Гудков, Тушинский округ №206. За месяц про него задали в Яндексе более 6800 запросов (здесь и далее все цифры по количеству запросов - с описанной выше поправкой на исключение фонового общероссийского уровня поискового интереса). 6800 запросов - это на треть больше, чем в сумме по всем остальным яблочным кандидатам. Справедливости ради надо отметить, что Тушинский округ наряду с Центральным вообще выделяется обилием поисковых запросов про кандидатов - если в других округах в сумме по всем кандидатам получается от 2,5 до 7 тысяч запросов на округ, то в Центральном 16 тысяч, а в Тушинском 19,5 тысяч. В общегородском топ-5 кандидатов по объему поискового спроса - исключительно кандидаты из Центрального (Баронова и Зубов) и Тушинского (кроме Гудкова, это еще Коротченко и Онищенко) округов.

Ну а кто из Яблока кроме Гудкова? На втором месте (если смотреть только на округа в Москве) Кирилл Гончаров из Нагатинского округа №201. Гончаров (он совсем молодой - 1992 года рождения) отличился уже в 2014 году на выборах в МГД, когда занял в округе второе место (24%) и показал один из лучших среди всех яблочных кандидатов результат. Сейчас он похоже проводит еще более мощную кампанию, и видимо в своем округе он - единственный реальный конкурент единоросски Паниной. Далее более предсказуемо - на третьем месте Юлия Галямина (Ленинградский округ №198), следом самый статусный из яблочных кандидатов Сергей Митрохин (Бабушкинский округ №196), "системный" правозащитник Андрей Бабушкин (Медведковский округ №200) и, с большим отставанием от них, Елена Русакова (Черемушкинский округ №209). У яблочных кандидатов во всех остальных округах от 75 до 250 запросов в месяц на каждого - это такой фоновый результат, который говорит о практически нулевой кампании и близком к нулевому отклике избирателей.

Помимо Гудкова и Гончарова, которые по количеству поисковых запросов лидеры в своих округах, еще только Галямина попадает в своем округе в первую тройку. Остальные яблочные кандидаты - на местах с 4-го по 6-е или в отдельных случаях даже ниже.

График вот. Чтобы остальные кандидаты не сливались с горизонтальной осью, пришлось Гудкова "обрезать" меньше чем на одной трети. А про другие партии тоже будет - но чуть позже


Дискриминация иноверцев в Москве: рост за 100 лет то ли в 4, то ли в 14 раз
barouh

Не удержусь и поразжигаю. Копий на тему того, нужно ли строить в Москве новые храмы, а тем более новые мечети, сломано уже много. Но любопытно посмотреть на вопрос в исторической так сказать ретроспективе

Итак, чуть больше 100 лет назад. Православная империя. В Москве около 1.4 миллиона жителей, из которых только 1% (14 тысяч) - мусульмане [1]. Подавляющее большинство населения города - православные (хотя еще были десятки тысяч староверов, и заметное количество протестантов и католиков). По данным из Брокгауза и Ефрона на 1902 год, в городе (в границах того времени!) было 443 действующих храма - примерно по 1 храму на 3 тысячи православных [2]

Мечетей было две - в Татарской слободе и в Марьиной Роще. Вторую мечеть - у нынешнего Олимпийского - построили в самом начале 20 века: хотя мусульман в Москве было еще немного, власти нехотя, но все же признали, что мечети в Замоскворечье недостаточно и дали разрешение на строительство второй. Так что получалось по 7 тысяч мусульман на одну мечеть - это примерно в 2,5 раза больше, чем аналогичный показатель для православных. Разница большая, но ожидаемая и наверное приемлемая для страны, в которой православие было официальной религией, и для города, большинство населения которого с основания составляли православные

Прошло 100 лет. Население города выросло почти на порядок - по официальным данным, до 12 миллионов. Статистики по конфессиям нет, но можно попытаться сделать примерные оценки. Вот например в исследовании "Арена. Атлас  религий", проведенном фондом Среда в 2012 году [3], 53% опрошенных москвичей заявили о себе как о православных. Если наложить эту цифру на население, то получится 6,5 миллионов человек. Церквей в Москве на конец 2012 года было 894 [4]. Правда, только около половины из них постоянно действующие, т.е. с регулярными службами и с прихожанами, - но и статистика 1902 года вероятно учитывает не только приходские церкви. 6500000/894 - это чуть больше 7 тысяч человек на один храм

С долей мусульман сложнее. Тот же проект Арена дал результат, что только 3% населения столицы - это мусульмане. В абсолютных цифрах это получается менее 400 тысяч человек. Но это явно заниженная оценка - традиционные методы опроса видимо плохо "вылавливают" этнические и религиозные меньшинства. Даже по данным переписи 2010 г. (для Москвы - сильно кривой и видимо приукрашенной), в Москве проживало около 350 тысяч представителей мусульманских народов (татары, азербайджанцы, узбеки и т.д.).

Альтернативную оценку можно сделать исходя из доли Москвы в мусульманском населении России. Судя по статистике поисковых запросов "намаз" или "байрам" [5], в Москве и области проживает почти 30% от всех мусульман в России, пользующихся интернетом. С поправкой на несколько большее проникновение интернета в Москве, чем в целом по России, это означает, что на Москву и область приходится примерно 20% мусульман, постоянно или временно проживающих в России. Из них собственно на Москву приходится вероятно около половины - т.е. ~10% от общероссийских цифр. По тому же исследованию Арена, в целом по России мусульман - 7%, 10 миллионов человек. Но как мы видим на примере Москвы, цифры Среды занижены. Альтернативная оценка исходя из данных переписи о том, что суммарная численность "мусульманских" народов России - около 15 млн человек, и из данных ФМС о пребывании в России почти 5 млн человек из преимущественно мусульманских стран, мы получаем оценку в 20 миллионов "этнических мусульман". Не все из них идентифицируют себя как верующие - а предположительно только 70-80%. Получается 15 миллионов мусульман, из которых десятая часть - т.к. примерно 1,5 миллиона - живет в Москве

Далее. Насколько мне удалось выяснить, в Москве 6 официальных мечетей (из них две шиитские). Даже если исходить из явно заниженной оценки в менее чем 400 тысяч мусульман, получается примерно по 65 тысяч человек на одну мечеть. Если же исходить из оценки в 1,5 миллиона, то это уже 250 тысяч человек на одну мечеть. Даже если исходить из официальных данных по национальному составу населения Москвы (

Получается, что по сравнению с началом 20 века, обеспеченность православного населения Москвы храмами снизилась примерно в 2,5 раза, а обеспеченность мусульманского населения - в 10-35 раз. "Коэффициент дискриминации" мусульманского населения с 2,5 вырос то ли до 9, то ли до 35

Спрашивается - исходя из этих цифр, храмы какой религии надо строить в Москве в первую очередь? Ну хотя бы для того, чтобы по уровню уважения прав "иноверцев" вернуться к показателям столетней давности

1907 2013
Православная империя Светская федеративная республика
Население Москвы, млн
(официально)
~1,4 12
Мусульман, млн 0,014 ~0,4 / 1,5
Православных (РПЦ), млн ~1,25 6,5
Мечетей 2 6
Православных храмов 443 (на 1902 г.) 894
Верующих на 1 мечеть, тыс 7 65 / 250
Верующих на 1 храм, тыс 3 7
Коэффициент дискриминации 2,5 9 / 35

P.S. С чего это я обратился к этой теме? Особого повода нет. Просто у меня есть список всяких статистических интересностей, про которые стоило бы написать. Вот добрался до одного из пунктов списка

[1] http://CyberLeninka.ru/article/n/musulmanskaya-obschina-moskvy-vo-vtoroy-polovine-xix-nachale-xx-veka.pdf
[2] https://slovari.yandex.ru/~книги/Брокгауз и Ефрон/Москва/
[3] http://sreda.org/arena

[4] http://eparchia.patriarchia.ru/db/text/3004275.html
[5] https://wordstat.yandex.ru/#!/regions?words=намаз + https://wordstat.yandex.ru/#!/regions?words=байрам


сколько народу в Москве с пригородами?
barouh
(решил перепостить эту уже не очень свежую запись из Фейсбука, потому что там все канет в бездну)

По официальным данным, в Москве и области проживает 13% населения России. А я вчера прикинул - у меня получилось минимум 14,5%, а скорее 17-18%. Т.е. не 18,5 миллионов человек, а минимум 20,5 млн., а скорее 24-25 миллионов
Обоснование оценки? Всякие веб-статистики с высокой степенью надежности показывают, что на Москву и область приходится от 19 до 23 процентов российской интернет-аудитории (подробности опускаю - но если кому интересно, могу рассказать подробно).
А все опросы, которые я видел, говорят, что в Москве проникновение интернета всего на четверть-треть выше среднероссийского уровня (если же добавить Мос.область, то превышение среднего по России уровня будет еще меньше). Сопоставление доли в интернет-аудитории и "internet affinity" для Московского региона и дает приведенную выше оценку - 17-18% (минимум 14,5%, максимум 19%)

По ссылке ниже - немножко обсуждения этих оценок
https://www.facebook.com/boris.ovchinnikov/posts/10151359725317304

однородно/неоднородно, устойчиво/неустойчиво
barouh
Как вы наверное помните, после декабрьских выборов я нарисовал по 402 городам график соотношения среднего (по городу) результата «Единой России» и среднеквадратичного отклонения (т.е. степени однородности голосования за ЕдРо по участкам города). Из того графика вырисовывались интересные наблюдения и выводы на тему того, где именно в декабре фальсифицировали выборы

Разные варианты графиковCollapse )

При всех различиях в визуализации, все эти графики говорят нам об одном и том же - об уменьшении на президентских выборах количества статистических аномалий: средний уровень дисперсии ниже, чем в декабре; городов, попадающих в основной («нормальный») кластер с достаточно однородным и относительно невысоким голосованием за власть, стало значительно больше, чем в декабре. Например, количество городов с СКО более 7% сократилось с 120 до 62, а с СКО более 10% - с 76 до 8.

Можно копнуть дальше, и посмотреть, как менялась (не)однородность результатов голосования по отдельным городам. На следующем графике показано СКО для декабрьских выборов (голосование за Единую Россию, ось X) и СКО для мартовских выборов (голосование за Путина, ось Y). Для наглядности я обвел рамками четыре основные группы точек.

сравнение дисперсии 2011 и 2012
(версия графика без рамочек)

В большинстве городов и в декабре, и в марте разброс результатов между участками был небольшим (СКО менее 7% для думских выборов и 6% для президентских), притом внутри этой группы (расположенной внутри синего овала) прослеживается четкая корреляция между уровнями однородности выборов в декабре и в марте. Иными словами, если естественная картина не искажается фальсификациями, то уровень «внутригородской дисперсии» является достаточно стабильной характеристикой.

Группа точек в темно-красной рамке – это города, в которых и в декабре, и в марте отмечалась высокая неоднородность голосования. Попросту говоря, это города, для которых есть основания говорить о заметных фальсификациях на обоих выборах. Впрочем, даже внутри этого прямоугольника большинство точек тяготеет к его нижней части, т.е. к уровню СКО на мартовских выборах в 6-8%, что говорит как минимум о снижении уровня фальсификаций по сравнению с декабрем.

Но вот например в Петербурге (большая точка с красной рамкой наверху графика) неоднородность результатов выборов по сравнению с декабрем практически не сократилась :(. А вот вторая укрупненная точка, расположенная внутри желтого прямоугольника - Москва - дает нам классический пример резкого сокращения СКО: за три месяца столица «вдруг» стала в электоральном плане намного более однородной.

Притом Москва – самый заметный, но не единичный пример резкого роста однородности голосования. Аналогичную ситуацию мы видим в Магнитогорске, городах Владимирской области, Туапсе, Шахтах, Сызрани, ряде городов Республики Коми.

Ну и четвертая группа на графике (красная рамка) – это города, в которых неоднородность результатов выборов заметно выросла в марте по сравнению с декабрем и достигла уровня, нехарактерного для честного подсчета голосов. Городов в этой группе относительно немного – меньше двух десятков – притом «механика» попадания в эту группу у разных городов разная: в одних случаях причиной является рост фальсификаций (например, Ханты-Мансийск, Аша в Челябинской области), а в других случаях – наоборот, нарушение однородности фальсификаций при заметном снижении их общего уровня (Саров, Прохладный, Кизляр).

Волшебники и среднеквадратичное отклонение
barouh

В многочисленных спорах про степень фальсифицированности декабрьских выборов постоянно звучит мнение, что мол разные районы Москвы (или другого российского города) могут сильно отличаться друг от друга по составу населения, и потому 2-3-хкратная разница в уровне поддержки Единой России - это нормально

Давайте посмотрим, насколько такие колебания действительно нормальны

что и как считалосьCollapse )
Представленный ниже график показывает распределение 402 городов по двум параметрам: среднему проценту за Единую Россию и по среднеквадратичному отклонению голосования за Единую Россию (отклонение по участкам городам от среднего по городу). То есть сравниваем средний результат ЕР по городу и степень однородности города по поддержке ЕР. При расчете обоих показателей учитываются только "полноценные" участки более чем с 1000 избирателей на каждом.

И что же мы видим? Мы видим несколько резко отличающихся друг от друга типов "поведения" городов. На графике каждый тип показан своим цветом. Ниже - комментарии и подробности. Если кратко – есть большая группа городов (больше 1/2 от всех) со стандартным «поведением» на выборах: в этих городах поддержка Единой России низкая или средняя, а разброс результатов по отдельным участкам – относительно небольшой. И есть вторая большая группа городов, в которых разброс в уровне поддержки ЕР намного больше, а средний по городу результат «партии власти» - средний или высокий. «Поведение» этих городов на выборах и их хаотичное расположение на графике выглядят странно, и дают веские основания предполагать наличие фальсификаций на существенной части участков этих городов.

уточнение для скептиковCollapse )

402 города - дисперсия ЕдРа

подробностиCollapse )

Итого получаем:
- в большинстве городов России (212 из 420 рассмотренных) характер распределения участков по уровню поддержки Единой России не дает оснований говорить о заметных фальсификациях
- средний результат ЕР по этим «стандартным» городам – 33%
- в то же время примерно в 150 городах по всей видимости на многих участках имели место фальсификации; среди этих городов – Москва, Петербург и многие другие крупные города

P.S. Поскольку видимо по этой теме будут еще посты, добавил специальный тег 402 города. Stay tuned


еще из фейсбука - любопытные цифры про выборы
barouh
Boris Ovchinnikov
а в Москве почти с полсотни участков, на которых у Яблока больше 20%. Рекорд - 29% - на одном из участков в Савелках (Зеленоград)
Like · · Share · 2 minutes ago

Boris Ovchinnikov
В России почти 40 участков (и это еще не посчитана большая часть Питера), где у Справедливой России больше 40% голосов. Больше всего таких участков в Якутии, также по несколько участков в пригородах Оренбурга и в Тверской области. Но и отдельные всплески в других регионах
Like · · Share · 5 minutes ago

Boris Ovchinnikov
А вот уже не кривизна протокола, а реальные результаты голосования. Общага Ярославского госуниверситета. Заволжский район, участок 78 (проголосовало около 180 человек)
ЛДПР 27.4%, КПРФ 26.8%, эсеры 20%, Яблоко 13%, ЕдРо 9%
Респект студентам. Респект ректору и коменданту общежития
Like · · Share · 7 minutes ago

Boris Ovchinnikov
Про серьезные цифры буду писать уже завтра. Пока же курьезы:
Енисейский район Красноярского края, УИК 1157. Патриоты России 60%, ЛДПР 16%, Яблоко 12%, эсеры 9%, ЕдРо - 0,7% (1 человек)
Но это кажись строчки в протоколе просто попутали. А в действительности там скорее всего (судя по результатам некоторых соседних участков) у КПРФ 60%, у ЕдРа 12%
Like · · Share · 38 minutes ago


Boris Ovchinnikov via Linda Sabantseva
Наш дурдом голосует за ПутинаВ московской психбольнице за ЕР проголосовали 93% избирателей
top.rbc.ru
В московской психбольнице за ЕР проголосовали 93% избирателей. В Москве в Психиатрической больнице им.Гиляровского на выборах в Государственную думу за партию Единая Россия проголосовали 93,14% ...
Like · · Share · about an hour ago


Boris Ovchinnikov
Система устроена таким образом, что у нее начисто отсутствует инстинкт самосохранения. Есть только инстинкт сохранения собственной задницы у отдельных винтиков системы

Надо быть последними идиотами, чтобы дразнить людей грубыми масштабными фальсификациями в Москве и Питере. Общий по стране результат они и так выправляют Дагестаном, Мордовией, Тулой и так далее. Ну не рассыпалась бы их власть от 25%-ного результата в Москве и Питере. Но нет, они просят граблей - и пытаются в двух столицах нарисовать себе процентов по 50

И эти фальсификации у всех на виду ударят по ЕдРу и тандему куда сильнее, чем честные цифры по двум столицам
Like · · Share · 2 hours ago

Boris Ovchinnikov
Смоленск (посчитана примерно треть участков?): КПРФ около 29%, ЕдРо меньше 25% - и только третье место после эсеров
Like · · Share · 2 hours ago

Boris Ovchinnikov
И еще одно замечательное место. Санаторий Красная горка в Кисловодске. Участок 621. КПРФ 48%, эсеры 19%, Яблоко 13%, ЕР 10%, ЛДПР 6%
Like · · Share · 2 hours ago

Boris Ovchinnikov
Страна должна знать своих героев (героев без кавычек). Межевской район Костромской области, участок 409, поселок Первомайский и деревня Поденьевица: КПРФ 41%, ЛДПР 22%, эсеры 20%, ЕдРо 17%. Надеюсь, что какие-нибудь журналисты доедут до туда и расскажут про эти замечательные места
Like · · Share · 2 hours ago

Собянин и Горбунов, мы вас не забудем и не простим
barouh
Первые цифры по Москве. И тут большие вопросы. Один из участков в Алексеевском районе: ЕдРо на четвертом месте (!) с 17%, эсеры 20%. Яблоко 22%, КПРФ 27%. Участки в Отрадном, Северном Тушино - у ЕдРа 19-20% и третье место. Ожидаемая картина

В то же время в Митино, Южном Тушино, Бабушкинском районе, где посчитано по несколько участков, у ЕдРа 28-30% (что уже сомнительно)

И, внимание, офигевшие: Дмитровский район Москвы - посчитано 3 участа, у ЕдРа 50%! Бибирево - 1 или 2 участка, ЕдРо 57%. Выхино-Жулебино - 1 участок, ЕдРо 43%

Вы верите, что в Москве такое неоднородное расселение (притом по прописке) и есть гетто, в которых сторонников Единой России в 3 раза больше, чем в остальной части города? Я не верю

Перепосты приветствуются - москвичи должны знать, что прямо сейчас у них под носом воруются и приписываются их голоса

цена жары и смога
barouh
В Москве смертность в июле выросла на 29,7%, сообщил информированный источник "Интерфаксу" ... Он напомнил, что в Москве умирают ежедневно "в среднем около 330 человек". "В июле же 2010 года этот показатель достиг 450 смертей в день и на 3,5 тысячи перекрыл среднестатистический показатель для этого месяца"
http://www.newsru.com/russia/06aug2010/smertnost.html

Если бы последствия нынешней жары у нас считались так же, как в Европе - по общему повышению смертности, - то говорилось бы не о полусотне погибших, а о многих тысячах. Только в Москве и только за июль - 3500 умерших сверх "нормы", а еще остальная Центральная Россия и не посчитан куда более страшный август...