Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
168 из 180
barouh
Неделю назад я писал про то, как изменился уровень однородности результатов голосования внутри городов между декабрем и мартом. В продолжение темы - немножко позитива: иллюстрация того, как логично и предсказуемо меняется уровень однородности там, где бюллетени считают честно

В статье для Троицкого Варианта по думским выборам я писал о группе из 180 городов, по которым есть наибольшие основания говорить о честном подсчете голосов (там невысокий уровень СКО, нет отрицательной корреляции между результатам Единой России и ЛДПР, а поддержка «партии власти» не превышает 47%). Подчеркиваю - состав этой группы был определен (вычислен) еще до мартовского голосования.

И вот как выглядит график соотношения СКО (среднеквадратичного голосования) в декабре (ЕР) и марте (Путин) по этим городам:


Коэффициент корреляции превышает 0,5, а если исключить пять красных верхних точек с резко выросшим (до уровня более 7%) СКО и, наоборот, семь желтых точек из нижней правой части графика с сокращением СКО более чем на 2 процентных пункта, то по оставшимся 168 городам R достигает 0,71 (для справки: линейный тренд для "очищенной" выборки описывается формулой y=0,64x+1%, где x – декабрьский СКО, а y – мартовский), а большинство точек (городов) отклоняется от линии тренда менее чем на 0,5%.


Примечательно, что наибольшее «честное» значение СКО для обоих голосований фиксируется в одном и том же городе – в Архангельске (6,8% в декабре и 6,0% в марте).

Пять верхних точек на графике – это Владивосток, Мурманск, Королев, Волжский и Саров. Первые 4 случая – это города, где фальсификаций не было или практически не было в декабре, а в марте они появились. Саров – исключение: здесь по всей видимости на смену равномерным фальсификациям на всех участках в декабре пришли масштабные фальсификации на отдельных участках в марте.

Семь городов с наибольшим сокращением СКО – это Красноярск, Хабаровск, Новочеркасск, Сосновый Бор, Тейково, Южноуральск и Козьмодемьянск. В декабре в этих городах разброс в поддержке ЕдРа был относительно большой (хотя и не превышающий критических значений) – примерно от 4,5 до 6,5%, а в марте повышенная «неоднородность» этих городов исчезла. Видимо, все-таки в марте декабре там были фальсификации, пусть и небольшие, которые и подняли искусственно уровень СКО на несколько процентных пунктов. А в марте фальсификаций не было совсем.

Хотя конечно надо бы подробнее посмотреть каждый из этих 7 городов (по крайней мере, на три первых – остальные слишком маленькие, по 12-20 участков в каждом, и в них существенное снижение СКО может определяться достаточно случайными факторами).

Продолжение следует

  • 1
(Deleted comment)
спасибо, исправил

А где на этом графике Москва?

//о группе из 180 городов, по которым есть наибольшие основания говорить о честном подсчете голосов //

москва не попала.

Понял, спасибо.

С моей точки зрения, в 2х крайних красных точках нет ничего выпадающего, все в пределах дисперсии.
Примерно то же относится к половине желтых точек.

А так все разумно. Есдинственно что - непонятен сдвиг в плюс один процент, но, возможно, это просто артефакт. Если его убрать, то наклон на глаз получается единица, что вообще замечательно.

1. Про две правые красные точки - это Владивосток и Мурманск. Там СКО выросло всего на 1,6-1,7%, что вроде в пределах нормы. Но от "очищенного линейного" тренда они отклоняются на 2,7% - тогда как "синие" точки, сильнее всего отклоняющиеся от линейного тренда, Краснознаменск и Электросталь, отклоняются от прямой всего на 1,9% и 2,1%
Это я к тому, что Владивосток и Мурманск сильно выбиваются уже по динамике СКО. А детали по участкам показывают, что статистическим отклонениям можно доверять. Про Владивосток точно не скажу - не "всматривался", а в Мурманске в марте было очень интересно и нечисто. Но об этом напишу отдельно

А про желтые точки я сам написал, что они требуют более подробного разбора

ну разумеется, есть точки, которые отклоняются больше и меньше, на то она и статистика.
а если еще провести линию через нуль, то отклонения вообще войдут в норму.

Да в том то и фишка, что есть точки, которые отклоняются в пределах нормы, и анализх данных по участкам для этих городов не показывает (по крайней мере, на первый взгляд) очевидных фальсификаций

И есть точки, отклонение которых аномально велика. И когда начинаешь "копать" эти города глубже, оказывается, что таки да, фальсификации появились

У меня как раз нет никакого желания загонять тот же Мурманск обратно "в норму"

2. Сдвиг в 1% (который я бы называл не сдвигом, а "фиксом") все же не совсем артефакт - там действительно есть эффект сглаживания. Если поделить 168 городов примерно пополам по величине СКО в декабре, то в нижний половине средняя величина СКО выросла с 2,5% до 2,7% в марте, а в верхней - снизилась с 4,3% до 3,8%.

Если брать для линейного тренда константу 0, то r снижается с 0,71 до 0,63 (ИМХО достаточно заметная разница), а коэффициент наклона получается 0,92

//СКО выросла с 2,5% до 2,7% в марте, а в верхней - снизилась с 4,3% до 3,8%.//

я сильно подозреваю, что все это внутри ашибпки измерений.

мне чем константа ноль нравится: из нее сразу получается вывод, что ско определяется местными неоднородностями и несильно зависит от выборов. Это именно то, что я ожидал бы интуитивно.

ну не тянет это на ошибку измерений (говорю, как упертый гуманитарий)
ОК, смотрим по другому: среди городов из нижней (по величине декабрьского СКО) половины, в марте СКО вырос у 52% городов. А среди городов из верхней половины - у 26% городов. Тоже ошибка измерений? (при том, что половина городов - это 84 кейса)

и если уж на то пошло, константа 1% кажется мне более логичной, чем 0% - эмпирические данные показывают, что для городов с честным подсчетом СКО всегда больше 1%. 1% - это как раз некий базовый уровень, ниже которого СКО не может опускаться

и все-таки СКО может зависеть как от особенностей города, так и от выборов (а точнее, от партии/кандидата, среднего уровня его поддержки и однородности или неоднородности его поддержки в разных социальных группах)

не-не-не, минимальный базовый уровень уровень говорит только о том, что в квадрате 1х1% точек быть не должно. Их и нет.

СКО, разумеется, может зависить и зависит -- не все же точки ложаться точно на диагональ. Прикол как раз в том, что получается, что в среднем по палате не зависит.

А сдвиг вообще не пойми о чем говорит. Впрочем, об этом я уже писал.

Насчет сдвига: вообще, могут быть какие-то эффекты, связанные с тем, что СКО по идее должно зависеть от среднего результата (чем результат ближе к 50%, тем СКО выше). Представим себе честный город с 25% за ЕР; за Путина там где-то 50%, и СКО должно возрасти. А в честном городе с 40% за ЕР за Путина может быть, условно, 80%, и СКО там упадет. Не получится ли в итоге как раз сдвинутой прямой с наклоном меньше 1? Не могу сообразить. Впрочем, вряд ли это построение имеет отношение к реальности.

Нет, не катит. Во-первых, у городов с ростом СКО нет никаких объединяющих признаков с точки зрения уровня поддержаи власти. Аналогично и для городов с резким падением СКО

Во-вторых, "честных" городов с поддержкой Путина на уровне 80 процентов нет. И даже 70 процентов кажется нет - хотя надо проверять (общий тренд, кстати: чем выше чистый результат ЕР в декабре, тем меньше прибавка голосов у Путина). Разница же в уровне неоднородности при 50 процентах и 65 процентах не должна быть большой

Но ок, пару вещей еще проверю

//чем выше чистый результат ЕР в декабре, тем меньше прибавка голосов у Путина//

ну разумеется: если рез.ЕР - 25%, то прибавить можно и 25, и 35%. А если он 75%, то 35 уже не прибавишь, а прибавление 25% сведет ско к нулю.

я не имел ввиду города с 70-80% за ЕР. Я имел ввиду различия между городами с 25% за ЕР и 40-45% за ЕР - а большинство "чистых" городов именно в этот диапазон и попадали

но действительно - "путинскую прибавку" (разница между Пу и ЕР в %% от проголосовавших) в грубом приближении можно считать как более-менее постоянный процент от суммарной доли голосов, отданных за другие помимо ЕР партии

Дополнение: некоторые цифирки (сам пока не до конца понимают, что они значат)

Разница в уровне СКО (март - декабрь) по массиву из 168 городов отрицательно коррелирует с результатом ЕР (на уровне -0,32) и слабее - с результатом Путина (-0,18). Слабая положительная корреляция (+0,15) - с дельтой между процентами Путина и ЕР

но тут предположу, что дело не столько в разности "арифметических" потенциалов роста и увеличения дисперсии для городов с разным уровнем поддержки власти - массив из 168 городов достаточно однороден по уровню голосования и за ЕР, и за Путина, "СКО для СКО" составляет всего 5-6% - а дело в том, что уровень СКО зависит от размера города, в больших городах он больше (я об этом писал применительно к декабрьским выборам), а одновременно оппозиционные города и более оппозиционные

Интересно, что если смотреть не на дельту СКО (март - декабрь), а на отклонение мартовских значений от линейного тренда, то при нулевой константе корреляции с уровнями поддержки ЕР и Путина сохраняются, а вот для "моего" тренда с +1% корреляции практически исчезают (-0,04 для ЕР, +0,09 для Путина), хотя сохраняется на том же уровне (~+0,15) корреляция с величиной "путинской прибавки"

Не только в квадрате 1х1, но и вообще левее от вертикали 1% и ниже горизонтали 1% точек быть не должно

Ну а в целом дискуссия о правильной линии тренда наверное не так важна:
- понятно, что есть существенная корреляция между СКО-2011 и СКО-2012
- понятно, что можно упрощать линию тренда, убирая из нее b и теряя при этом отчасти в "качестве" тренда - а можно и не упрощать, закрывая при этом глаза на некоторую "физическую" неоднозначность получающегося уравнения
- понятно, что есть точки, которые максимально далеко отстоят от линии тренда (притом если проводить линию через 0,0, то у нас мало что меняется - внизу выпадают все те же 7 точек, а наверху с "отщепенцам" прибавляются Краснознаменск, Электросталь и Среднеуральск), и тут только вопрос: является ли особость этих точек свидетельством фальсификаций (что сразу исключает эти точки из массива "чистых" городов), или это просто случайные проявления отклонений от средней линии тренда. Мне ближе первый вариант, но это все равно можно проверить только разбор каждого такого города на уровне УИКов

забавная перекличка: в френдленте прочитал напоминание про эффект усреднения

http://avva.livejournal.com/2426970.html

и должен признать, что "мой" тренд - с наклоном меньше 1 и константой в 1% - несет в себе вполне отчетливые признаки именно такого сглаживания случайных экстремумов

Да, позор (мне).

ну уж скорее позор мне - я отстаивал важность константы в 1% :)

Добрый день, давайте дружить! :)

  • 1
?

Log in

No account? Create an account