?

Log in

No account? Create an account

Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
Шерсти клок - на 90 тысяч строк
barouh
От путинской затеи с видеокамерами на участках получился любопытный "клок шерсти" (ну помимо некоторого количества видеороликов разной степени пристойности и криминальности): по моей наводке добрые (и умные) люди выкачали с сайта webvybory.ru весь массив данных по адресам и геокоординатам участков, на которых были установлены камеры

Всего - более 91 тысячи участков!

Надо сказать, что до сих пор в распоряжении исследователей не было единого массива данных по адресам участков. Приходилось рыскать в поисках разрозненных данных по отдельным регионам и районам. Теперь же - ура - есть единый массив. С этими данными можно строить много всякой новой аналитики, включая сравнение городов, больших сел и мелких деревень, анализ различий в голосовании между пригородами и "медвежьими углами" и так далее

Более того, насколько я понимаю, выкачанный с циковского сайта массив - это вообще едва ли не самый подробный (из публично доступных) массив данных по географии населения (взрослого населения, если быть точным). Например, можно построить "рейтинг" из более чем 5500 населенных пунктов, в которых было образовано более чем по 1 избирательному участку (т.е. в которых проживает более чем по 3 тысячи избирателей)

А еще было бы здорово найти добровольцев, которые бы сделали гео-машап - наложение результатов выборов на Яндекс.Карты. Любопытный сервис получился бы


  • 1

про первые результаты

ух, здорово

Я пока не стал это "рекламировать" - потому что если получится это причесать в ближайшее время, то лучше наверное в широкую циркуляцию пускать уже в причесанном виде

И я посмотрел только картинки - "внутрь" не влезал

Теперь про конкретику:
(1) я смотрел количество участков с совпадающими координатами И адресами - максимум по Москве 5 участков в одной точке, и таких два случая на всю Москву. Все остальное - это или ошибки разбора данных и "полигонизации", или отсутствие в исходном массиве точных данных по координатам: в некоторых районах часть участков (или даже все участки) записывались скопом на одну условную точку (географический центр района). Как это "лечить" - не знаю. Вручную добавлять координаты участков с неточными координатами?
(2) еще забыл предупредить, что в некоторых случаях для участков, находящихся в одном здании, указывались разные координаты (отличающиеся четвертым-пятым знаком после запятой). Т.е. видимо они точно замеряли координаты одного и другого крыла школы - но понятно, что расположение точек голосования относительно друг друга ничего не говорит о расположении соответствующих "полигонов" относительно друг друга. Тут для исправления надо или суммировать не только участки с одинаковыми координатами, но и участки с одинаковыми адресами. Или округлять координаты (до скольких знаков после запятой - сейчас точно не помню), хотя последнее поможет лишь отчасти: разница в координатах между двумя крыльями одного здания и двумя соседними зданиями может быть одного порядка
(3) про визуальную сторону - а почему пропорции Москвы искажены? она как бы сплюснута. Это сильно мешает восприятию
(4) а еще восприятию мешают точки участков за пределами административных границ города - их нельзя убрать/отфильтровать?
(5) на путинском графике для максимальных значений заливка участков и границы участков сливаются - так что получается ощущение одного большого темного района, а не многих небольших одноцветных
(6) как определяется границы цветов? сложный алгоритм? задается вручную? (кстати, пестрость графика Зюганова возможно объясняется тем, что у него действительно достаточно равномерная поддержка по городу, а узость отдельных цветовых диапазонов приводит к достаточно большой степени случайности в попадании участка в одну или другую цветовую градацию
(7) есть участки, по которым нули у всех, включая Путина. Например, между Ярославской и Лосиным Островом. Это надо проверять

p.s.(8) в градации не должен использоваться белый цвет - должно быть разделение между цветом "пустоты" (отсутствия данных, участков в нулевыми данными) и низкими результатам

Я много написал на тему "как должно быть". Я увы не готов это все делать сам - но если есть конкретные вещи, по которым я могу помочь, то я готов участвовать в доводке

Edited at 2012-03-29 08:54 pm (UTC)

  • 1