?

Log in

No account? Create an account

Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
Шерсти клок - на 90 тысяч строк
barouh
От путинской затеи с видеокамерами на участках получился любопытный "клок шерсти" (ну помимо некоторого количества видеороликов разной степени пристойности и криминальности): по моей наводке добрые (и умные) люди выкачали с сайта webvybory.ru весь массив данных по адресам и геокоординатам участков, на которых были установлены камеры

Всего - более 91 тысячи участков!

Надо сказать, что до сих пор в распоряжении исследователей не было единого массива данных по адресам участков. Приходилось рыскать в поисках разрозненных данных по отдельным регионам и районам. Теперь же - ура - есть единый массив. С этими данными можно строить много всякой новой аналитики, включая сравнение городов, больших сел и мелких деревень, анализ различий в голосовании между пригородами и "медвежьими углами" и так далее

Более того, насколько я понимаю, выкачанный с циковского сайта массив - это вообще едва ли не самый подробный (из публично доступных) массив данных по географии населения (взрослого населения, если быть точным). Например, можно построить "рейтинг" из более чем 5500 населенных пунктов, в которых было образовано более чем по 1 избирательному участку (т.е. в которых проживает более чем по 3 тысячи избирателей)

А еще было бы здорово найти добровольцев, которые бы сделали гео-машап - наложение результатов выборов на Яндекс.Карты. Любопытный сервис получился бы

  • 1

Re: Насколько я себе представляю

> 1. Вопрос чайника - что такое OSM?

OSM=OpenStreetMap, http://www.openstreetmap.org/index.html?lat=56.91&lon=42.2&zoom=6

> И тут надо ведь исключать не только воду и леса, но и промзоны, парки и т.п.

В OSM десятка полтора видов земплепользования. Чтобы увидеть полный список кликните на "Map Key" в левой колонке на странице ОСМ.

> Я не спорю, что это можно сделать - но это потребует куда больших временных усилий, чем реализация варианта с точками

Несильно больших -- в обычной ГИС типа GRASS или ArcGIS построить полигоны, а потом вычесть из них землепользование это примерно 3 команды.

> 2. Предполагаемое соседство участков представляется мне менее надежной характеристикой, чем расстояние между участками.

По хорошему с случае с выборами надо исследовать и то, и другое. Построение зависимости между разницей показателя от удаленности предполагает определенную гладкость (отсутствие "скачков", "гребней", и пр.) поверхности показателя. В случае же выборов мы имеем смешанную ситуацию: в пределах некоторых территорий показатели будут вполне гладко меняться, а потом будут всякие скачки обычно там, где сильно меняется социальный состав населения. При исследовании же соседства такие места буду хорошо заметны.

Потом с расстоянием еще есть некоторые проблемы. Иногда близкие на карте районы оказываются очень мало связаны, пример в Москве -- Курьяново и Каширка. Т.е. использовать расстояние по дорожной сети может иметь больше смысла, чем расстояния по прямой.

> В любом случае карты по участкам интересны не столько в масштабе страны или Москвы, сколько в масштабе ТИКов.

А еще более интересны они на границах ТИКов чтобы понять как и почему разнятся результаты близких ТИКов.

> 4. Пример по Москве: http://mosgorizbirkom.ru/list-Inside-doc-WholePage.aspx?RgmFolderID=0ca2051d-085f-4228-b283-af0b0b582c3c Если посмотреть внимательно, то можно увидеть, что даже в пределах Москвы в разных округах разный формат записи адресов

Спасибо! Piece оf cake! Я там заметил 3 системы привязки -- по улице-дому-корпусу, по корпусу в Зеленограде, и (редко) по названию учреждения. Программа разборки списка адресов на Перле или Питоне уложится ну строк в 20 от силы. OSM по Москве содержит контуры зданий с номерами и корпусами. Т.е., построить границы участков по Москве работы примерно на день.

  • 1