?

Log in

No account? Create an account

Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
техническое
barouh
для любопытствующих выложил основные данные (среднеквадратичное отклонение голосования за ЕР + некоторые другие параметры по городам): https://docs.google.com/spreadsheet/ccc?key=0AqPgHiOWRZ2JdENMX1d0V3h6SlZ6M1QxWDNiZDI4TFE

попутно заметил, что даже по "стандартным" городам прослеживается зависимость среднеквадратичного отклонения от размер города (количества избирательных участков) - чем больше город, тем выше наблюдаемые значения СКО. Если среди городов в 10-20 участков даже значения СКО менее 2% встречаются достаточно часто, то  среди городов в 200 и более участков (это примерно 500 тыс. жителей и более) минимальное СКО - около 4%

очевидного математического объяснения этот феномен не имеет. Рабочие версии:
- возможно, я зря использовал среднеквадратичное отклонение - при его использовании один резко отличающийся от среднего участка влияет существенно сильнее на общую по городу оценку отклонения, чем при использовании среднего линейного отклонения
- в больших городах больше вероятность формирования "кварталов", в которых социальный состав и политические предпочтения избирателей существенно бы отличались от среднегородских
- в больших городах больше вероятность (в силу большего количества участков), что даже при отсутствии команды на фальсификации сверху (с уровня города или ТИКа) на отдельных участках проявят "инициативу" и подрисуют результаты 

какие из этих объяснений ближе к истине, пока сказать не могу

  • 1
Про распределение SD отвечу позже - там посчитать-уточнить надо

Про почасовой анализ для Москвы очень интересно - с нетерпением жду результатов, и тогда сам пока не буду касаться этих данных

Про "возьметесь" - я бы взялся и даже пытаюсь двигаться вперед, но работу работать надо. Так что ничего обещать не могу. Буду пробовать двигаться в том же формате - выкладывая результаты и мысли по кусочкам и обсуждая. Если какие-то вещи получится делать сообща - буду рад

У нас в запасе еще полтора месяца до следующих выборов :)

ну, речь не идет про завтра.

просто, с одной стороны, дубляж работы необходим для проверки, а с другой - он снижает эффективность. Эффективности, кстати, отнюдь не помогает разное представление данных (это к нашему вчерашнему обсуждению). Поэтому если бы вы взялись посмотреть на динамику городов вашего списка, то это был бы еще один критерий.

а если дополните ваш список явкой, то третий критерий я вам моментально отрисую. Сделайте, пожалуйста, что вам стОит еще колоночку посчитать?

что именно еще посчитать? уточните, что нужно - постараюсь посчитать

нужно дополнить ваш файл колонкой "явка" -- т.е. отношением числа проголосовавших к списочному составу.

тогда я сразу нарисую гистограму ер%-явка%, где помечу малодисперсионные города.

добавил 2 колонки туда же: https://docs.google.com/spreadsheet/ccc?key=0AqPgHiOWRZ2JdENMX1d0V3h6SlZ6M1QxWDNiZDI4TFE&hl=en_US#

вторая колонка - стандартное отклонение по явке

Как и для % ЕР, явка считается не как отношение суммарных чисел по городу, а как среднее от явки по отдельным участкам с количеством избирателей более 1000

Edited at 2012-01-18 03:10 pm (UTC)



добавил фит и ожидаемую из биномиала дисперсию (отскалирована произвольно, чтоб пересекала "правильный" кластер примерно посередке).

1) как именно считается Mean SD?
2) на верхней вставке где участки с долей ЕР менее 30%, 35-45%, 50-60% и более 60%?

1. как первый момент распределения количества участков в диапазоне 2% для голосов ЕР.
2. нигде. Я показал только 3 репрезентативных среза.



какая-то корреляция есть, но не сказать, чтобы очень.

Корреляция есть. Для городов с большим разбросом связь явки и процента ЕР очевидна (в то же время стоит обратить внимание на то, что во многих случаях большой разброс сочетается со стандартнрй средней явкой и процентом ЕР, который укладывается в нормальную часть распределения

А вот для городов с маленьким разбросом корреляция явки и результата ЕР прослеживается только для городов с явкой за 65 процентов и результатом ЕР больше 45 процентов

Но в целом - ничего экстра-нового

Но в целом - ничего экстра-нового

вот это-то и обидно.

  • 1