Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
География плотности населения в Москве
barouh
Все началось вот с этого поста у юзера kireev - на карте показано распределение населения США. Один человек - одна точка. Место проживания дается с точностью до квартала. Эта карта наглядно показывает сравнительную плотность населения - как по стране в целом, так и по отдельным кварталам крупных городов. Видна и структура расселения за пределами мегаполисов.
Естественно, что по России, и в частности по Москве, таких подробных данных в открытом доступе нет. Публичная статистика по численности населения детализируется максимум до уровня районов. Но прошлой весной, благодаря путинской затее с видеокамерами на избирательных участках, появился новый любопытный массив данных по всей стране - с рекордной для России детализацией: это данные по избирательным участкам, включая как количество избирателей, приписанных к каждому участку, так и географические координаты места для голосования.
Вот с этими данными на примере Москвы я и поигрался. Конечно, количество внесенных в список избирателей не всегда пропорционально количеству жителей - даже внутри одного города от района к району может существенно колебаться доля несовершеннолетних, и уж тем более возможны существенные колебания по соотношению реальной численности населения и количества людей, зарегистрированных в данном районе (а списочная численность населения определяется именно на основе данных о постоянной регистрации). Но все же для первой прикидки плотности населения и такие данные сойдут.

Под катом - карты Москвы, показывающие распределение избирательных участков, сравнительную плотность населения в разных частях города и места расположения наиболее плотно застроенных "муравейников". Плюс небольшие комментарии и методологические пояснения

Рисунок №1 - избирательные участки на карте Москвы. Площадь кружочка пропорциональна количеству избирателей, проживающих на данном участке (или группе участков, если они голосуют в одном здании). Значения по осям X и Y - географические координаты. Эту карту я уже вывешивал в Facebook - но почему бы ее не воспроизвести еще раз.



Методологические детали: при подготовке карты было исправлено несколько ошибок с координатами участков, которые были на официальном сайте системы видеонаблюдения. Участки, расположенные в одном здании и имеющие одинаковые координаты, были сгруппированы (т.е. как правило одно помещение для голосования = одна точка). В немногочисленных случаях, когда у двух участков в одном здании пусть и очень близкие, но несовпадающие координаты (соответствующие реальному расположению участков внутри здания или возможно дифференцированные от балды), группировка не проводилась - то есть на карте могут быть сливающиеся точки, координаты которых отличаются лишь на десятки метров (но таких случаев немного).
На карте непоказаны "закрытые" участки (больницы, роддома, СИЗО), поскольку на них не было видеонаблюдения и соответственно их координаты отсутствуют в базе. Также вручную исключены другие участки, не имеющие постоянных списков избирателей - это участки на вокзалах, а также участки-"невидимки", созданные к мартовским выборам для голосования по спискам предприятий с непрерывным режимом работы.
Данные по численности избирателей взяты с исключением использования открепительных удостоверений - то есть для каждого участка из количества избирателей в списке на момент окончания голосования вычитается количество проголосовавших по ОУ (т.е. не проживающих на территории данного участка) и добавляется количество избирателей с данного участка, получивших до дня голосования открепительное удостоверение в ТИК или УИК. Такая корректировка позволяет максимально приблизить данные к оценке распределения населения (взрослого) по месту регистрации, а не по месту пребывания днем в выходной день.


Уже на этой карте видны разные любопытные вещи. Например, хорошо прослеживаются две основные зоны расположения районов с максимальной плотностью населения - это большой пояс на востоке от Гольяново до Бирюлево (почти все районы в этом поясе очень "плотные" - но при этом есть и много широких "пробелов" между районами) и это север Москвы, между Ярославским шоссе и Октябрьской ЖД, где не только высока плотность застройки внутри отдельных районов, но и промежутки незаселенных пространств между районами очень невелики. Видна и самая большая в Москве область сплошной жилой застройки - это "средний пояс" между Варшавским шоссе и проспектом Вернадского.

Рисунок №2. Тот же самый координатный график, но уже совмещенный (пусть и примерно) с картой Москвы (при этом исключены сильно выбивающиеся районы вроде Зеленограда и Внуково). Карта для тех, кого интересует плотность в каком-то конкретном районе.



Рисунок №3. "Сетка" плотности населения (ну а точнее, плотности избирателей). Вся Москва разбита на квадраты примерно 1250х1250 метров



Шаг (размер стороны квадрата) в 1250 метров был выбран исходя из того, что больший шаг дает слишком огрубленную картину, а при меньшем шаге (например, 1000 метров) существенно увеличивается доля случайных результатов, например, вырастает доля квадратов, включающих только одну точку (одно помещение для голосования), снижается средний коэффициент корреляции по количеству точек по квадратам между двумя соседними горизонталями или двумя соседними вертикалями.
Размер шага равен 1250 метрам примерно, а не точно, поскольку границы квадратов осуществлялись примерным пересчетом расстояний в метрах в градусы и минуты долготы и широты.
Рассматривая эту картинку, стоит обращать внимание не столько на размер конкретной точки, сколько на сгустки больших или, наоборот, маленьких кружков. Результат для конкретного квадрата очень сильно зависит от того, с какой точки начинать "чертить" сетку и какой именно размер шага выбрать. Часто достаточно чуть-чуть сместить границы квадрата, чтобы оценка плотности населения в этом квадрате существенно поменялась. А вот если мы видим группы точек с высокой плотностью, то понятно, что качественно картина для данной части города останется такой же, как не двигай сетку.


На приведенном графике есть 8 точек (квадратов) с количеством избирателей более 40 тысяч (в пересчете на квадратные километры это более 25 тысяч избирателей на кв. км.) Для сравнения - в центре города, в радиусе 6 км от Кремля, есть только один квадрат - в районе м. Пролетарская - с количеством избирателей более 23 тысяч (т.е. >15 тыс. чел./кв.км.). Впрочем, скорее поражает как раз противоположное - относительно небольшая разница между центром и окраинами: даже в пределах Садового кольца есть районы (квадраты), в которых плотность населения всего в 2-2,5 раза уступает максимальным значениям спальных районов у МКАД. И эти центральные районы еще вмещают огромное количество рабочих мест, и все равно по пригодности для жизни ИМХО сильно превосходят окраинные "муравейники".

Рисунок №4. На закуску - карта районов города с максимальной плотностью. Показаны только квадраты (уже размером 1х1 км), в которых плотность избирателей превосходит 25 тысяч человек. Для большей наглядности различий между отдельными точками, количеству избирателей тут соответствует не площадь кружка, а его диаметр.



Как это считалось? Чтобы хотя бы отчасти избавиться от высокой зависимости результатов от выбора "нулевой точки", используемой при нарезке Москвы на квадраты, пришлось прибегнуть к специальной процедуре. Сначала на Москву "нарезал" на квадраты со сторонами в треть километра (т.е. по 9 квадратов на километр). Потом для каждой точки (центра квадрата) было посчитано количество избирателей в сумме в собственном квадратике этой точки и в 8 соседних квадратиках (т.е. посчитал количество избирателей в квадрате 1х1 км с центром в данной точке). Получилась сетка из большого количества накладывающихся друг на друга квадратов (у каждого квадрата есть 4 других квадрата, с которыми он пересекается на 6/9 площади, 4 квадрата с пересечением 4/9, 4 квадрата с пересечением 3/9, 8 квадратов с пересечением 2/9 и 4 квадрата с пересечением 1/9).
Дальше отфильтровал эти квадраты - оставил только те квадраты, у которых (а) количество избирателей больше, чем у любого из 8 соседних квадратов или (б) у которых количество избирателей хотя бы не меньше, чем у любого из 24 квадратов, с которыми у него частично пересекается площадь, и при этом среди 8 ближайших "соседей" нет квадратов без избирателей. Дополнительно, если после такой фильтрации оставалось 2 или 4 соседних квадрата с одинаковым количеством избирателей, то такие квадраты объединялись - с высчитыванием среднего от координат их центров.
На выходе получилось около 500 квадратов (прошедших все фильтры) - которые с достаточно высокой степенью точности показывают для каждого района города, где в нем наблюдается наибольшая плотность населения. Понятно, что у такого алгоритма есть свои недостатки - границы квадрата 1х1 могут случайно расположиться так, что сразу несколько помещений для голосования окажутся внутри квадрата, но совсем близко от его границ: в этом случае мы всех избирателей с этих участков посчитаем внутри квадрата, хотя скорее всего около половины из них живет за его пределами. Понятно, что есть районы, которые в принципе плохо "ловятся" квадратами 1х1 - например, если это узкая полоса жилой застройки например между шоссе и железной дорогой. И так далее. Но все же подбор "оптимальных" квадратов с тестированием вариантов через каждые 333 метра дает более точную и аккуратную картину, чем прямолинейная "нарезка" Москвы на квадраты.


Самый большой кружок на графике - 52 тысячи избирателей на 1 кв. километр! - расположен в Северном Чертаново, к юго-западу от метро Чертановская.
Впрочем, на приведенном ниже графике (представляющем схему расположения избирательных участков в этом и в соседних квадратах) хорошо видно, что квадрат-рекордсмен (тот, который с красными точками) очень удачно "нарезался" - почти все участки в Северном Чертаново попали именно в этот квадрат. Понятно, что существенная часть из 52 тысяч избирателей, хотя и голосует на участках, расположенных внутри квадрата, живет за его пределами, ближе к Битцевскому парку или, наоборот, к Варшавскому шоссе.



По плотности населения (электората) Северное Чертаново намного опережает все остальные районы Москвы. Второй результат - принадлежащий квадрату с центром около метро Алтуфьевская - составляет менее 39 тысяч. Почти столь ко же - примерно по 38 тысяч - у двух квадратов в Митино, а также у точек в Зеленограде и Бирюлево.

Но вообще и на графике с подбором максимальных плотностей населения опять-таки интереснее смотреть не на отдельные точки, а на их скопления (которые уж точно не являются результатом случайного совпадения). Больше всего квадратов с очень высокой плотностью населения в Орехово-Борисово и Братеево и около метро Алтуфьевская. Рядом с первым кустом есть еще Марьино и Бирюлево, где также повышенная плотность, и аналогично рядом со вторым кустом есть Медведково и Отрадное. Можно еще отметить Ясенево, Беляево, Строгино, Тушино.
А вот в пределах Малого кольца МЖД на этой карте отмечена только одна точка - в Богородском. И между Кутузовским и Ленинским такая точка только одна. Зато точки повышенной плотности населения есть практически во всех районах за МКАД - и в Митино, и в Солнцево, и в Бутово, и в Новокосино, и в непоказанном на карте Зеленограде.

  • 1
Интересное исследование.

Великолепно.
А вот мой трэш по тем же данным (по варианту 1,5 х 1,5 км): http://sevabashirov.livejournal.com/13211.html
Еще по идее плотность должна коррелировать со средней этажностью застроечных участков.

Если не возражаете, воспроизведу Вашу карту тут - мне Ваш вариант представления данных нравится, я просто поленился сам делать подобное



Edited at 2013-01-31 05:01 pm (UTC)

Предполагаю вам будут интересны карты сделаны мной по выборах в РФ: http://statistika.in.ua/ru/vybory2012/

Конкрентно карту густоты населения могу легко сделать нормальную(побольше, без "кубиков" и наложеную на Гугл-карту), в духе вот этого: http://statistika.in.ua/twitter/ukrainska_vs_rosiyska

1. Как сделать максимально интересными и информативными поучастковые карты по результатам выборов, я периодически задумывался - но пока ничего интересного не придумалось

2. Что касается карты плотности, то нормальное наложение на Гугл-карту действительно может быть интересно. Может быть, самый наглядный вариант - размер круга пропорционален количеству избирателей в данной точке, а цвет круга - количеству избирателей в определенном радиусе от точки

http://www.citypopulation.de/php/russia-moskvacity.php - нашел хоть что-то с заливкой по градациям. Правда, внутри самой Москвы (без учета Новой Москвы и Молжаниновского) различается от силы 8-10 ступеней, да и население размазано и по паркам с промзонами в том числе, но это уже кое-что.

(Deleted comment)
... то ли вы бот

То ли вы разговариваете с ботом :)

Публичная статистика по численности населения детализируется максимум до уровня районов.

Есть данные переписей вплоть до уровня муниципалитетов.

Московские районы по населению одного порядка с областными, а на муниципалитеты не делятся. Есть деление по кадастровым кварталам, есть - по неизвестно как определенным частям районов http://www.basman.ru/upload/karta_basman.jpg, но безо всяких данных.

Edited at 2013-02-17 01:32 am (UTC)

Да, ошибся. В тот момент я еще не знал про наличие в "паблике" данных про численность населения по поселениям (муниципалитетам)

Но если говорить о Москве, то тут действительно район является предельным уровнем детализации данных

Обнаружил вот такое исследование: http://andreygeo.livejournal.com/4430.html
Там есть ссылка на карту, но на всякий случай продублирую: http://geo.mgubs.ru:8080/api/index.html?A96WP
(карта не без багов, конечно)
___

Недавно посчитал по присланным вами данным о населении по УИКам центр народонаселения Москвы.
Допущения:
- считал как центр масс плоской фигуры, пренебрегая сферичностью Земли (хотя высота сегмента радиусом 20 км в районе 30 м);
- считал, разумеется, центр только населения с правом голоса, учтенного в УИКах (с учетом открепительных), пренебрегая разной концентрацией оного по районам (см. http://sevabashirov.livejournal.com/68213.html );
- считал, что координаты каждого УИКа - это центр тяжести приписанного к нему населения (флуктуации по идее должны друг друга погасить);
- не исключал спецучастки, т.к. не знаю четких критериев их выявления, так что даже не начал заморачиваться.

Итог: центр населения десяти адм. округов Москвы - 55,744165 37,602051 (перекресток Остоженки и Бульварного кольца, неподалеку от ХХС и м. Кропоткинская), без Зеленограда - 55,738128 37,612384 (Президент-отель на Якиманке). С Новой Москвой - где-то в районе м. Парк Культуры, точнее не сказать, т.к. нет данных.

Тем временем географический центр переехал с ул. Ленивки в поселок Радиоцентр, что подсчитали в моем институте: http://www.miigaik.ru/novosti/novosti/2014/09/11/914/

Edited at 2014-11-02 04:46 am (UTC)

Спасибо. Интересно

  • 1
?

Log in

No account? Create an account