TGINSIGHT CHAT
О городах и данных
@datainthecity
TechnologiesКанал про то, кто, как и зачем измеряет города: как исследования,построенные на городских данных, улучшают жизнь в городе и какие риски они несут Автор:@intra23 Сайт: http://geopython.su/
Recent posts
Page 1 of 26 · 305 posts
Posted Apr 25
Пока все ждут кризиса рынка недвижимости на Манхэттене из-за программы социального жилья нового мэра Нью-Йорка, его опередила Каталония. В Каталонии, и в первую очередь, в Барселоне есть проблема: из-за огромного количества туристов всё больше квартир сдаются в Airbnb, тем самым уменьшая предложение долгосрочной аренды и повышая цену. Для понимания при средней испанской зарплате в 3000$, снимать однушку в центре города стоило в 2025 ~2000$ Правительство решило "помочь" гражданам и в начале 2026 года установило лимит на максимальную стоимость аренды квартиры. Теперь нельзя сдать однушку больше 1400$ в месяц. Как вы думаете, помогло это? Ровно наоборот: моя подруга, которая живет в центре Барселоны рассказала, что арендодатель больше не хочет продлять договор аренды - он переходит на airbnb. Несмотря на доп налоги, расходы на сервис и повышенные риски, при новой разнице в цене ему выгодно сдавать посуточно. Итоговый результат: в туристическом центре теперь вообще нет предложений для аренды. Да, скорее всего, рынок отыграет немного назад, но это потребует времени, и все равно предложений для жителей останется сильно меньше, чем было. Вчера в разговоре меня пытались убедить, что правительство Каталонии не виновато - рынок недвижимости не предсказуем, и они не могли знать, как поведут себя арендодатели. На самом деле, конечно могли, если бы в принятии решения участвовал здравомыслящий человек экономист. Человек - рациональное существо, которое всегда пытается увеличить для себя выгоду. В данном случае владелец квартиры думает, как максимизировать доход с недвижимости: сдавать ее местным или туристам. И его ответ зависит от того, что стоит на месте знака вопроса ниже: AIRBNB PRICE + LONG TERM RENT COSTS +LONG TERM RENT RISKS ? LONG TERM RENT + AIRBNB COSTS + AIRBNB RISK Если больше левая часть, то человек выберет Airbnb, если правая - сдачу в аренду. А теперь подумайте, что случится, если в правой части снизить LONG TERM RENT. Правильно - левая часть будет чаще выигрывать у правой! Ничего неожиданного, правда? Как можно было бы решить проблему? Если подумать, то сделать ровно наоборот - ввести ограничения на рынок посуточной аренды, сделав ее менее привлекательной в глазах арендодателя или облегчить условия долгосрочной аренды. Правда тогда регион должен был бы взять расходы за упущенную выгоду на себя, а не перекладывать их на арендодателей. Например, можно было бы: 1. Ограничить стоимость аренды на Airbnb (снизить AIRBNB PRICE). 2. Повысить такс на Airbnb (повысить AIRBNB COSTS) 3. Упростить условия сдачи в долгосрочную аренду: снизить налоги, улучшить систему защиты арендаторов (снизить LONG TERM RENT COSTS и LONG TERM RENT RISK). Во всех этих случаях правая часть неравенства стала бы чаще выигрывать у левой, и людям стало бы менее выгодно сдавать квартиры туристам. Предложение для жителей увеличилось бы и постепенно стоимость аренды снизилась, придя к новой точке равновесия. Дополнительным бонусом стало бы ограничение туристической нагрузки. Минус, как написала выше: недополученная прибыль города от налога с Airbnb. Но кому какое дело до формул, если можно принять "громкое", политически красивое решение.
Posted Apr 10
Как узнать, куда уехали люди(быстро, бесплатно и без регистрации) Как только начинаются крупные военные конфликты, появляются исследования о перемещениях людей. Такие ресечи примечательны 4-мя вещами: - выполнены за очень короткое для академии время - используют открытые данные, либо открывают их вместе со ресечем - несложная методология, которую легко повторить - учитывают ограничения, вызванные конфликтом В 2022 такое исследование делала Мета про жителей Украины (писала тут), сейчас исследователи из университета Ливерпуля выпустили статью про передвижение жителей Ирана с февраля 2026. Данные (самое интересное!) Из-за боевых действий и масштабных блокировок прямые демографические данные в Иране недоступны. Поэтому исследователи отслеживали перемещение населения с помощью данных об HTTPS-запросах от Cloudflare. Этот подход возможен, потому что а) сеть не падает полностью, например, для медицинских и банковских услуг она продолжает работать, б) данные открыты, обновляются каждый день по всем странам (включая Россию) WorldPop данные о населении регионов Ирана Так же открытые данные API Wikimedia: оттуда брали статистику по запросам к Википедии на Фарси, привязанную к локациям И карту ударов Iran Strikes Map Методология 1. Создание базовой модели Исследователи проанализировали трафик за декабрь 2025 года (до начала войны), чтобы установить связь между численностью населения в регионах и долей интернет-трафика в каждой провинции 2. Оценка в военное время Эту модель применили к новым данным о трафике и посмотрели по дням, где самые большие перекосы в соотношении трафик/население. 3. Корректировка и валидация Чтобы убедиться в точности выводов, данные Cloudflare сравнили с просмотром страниц персидской Википедии. Особенно это важно было сделать на границах с другими странами, чтобы отделить сигналы иранцев от жителей Азербайджана и Афганистана. Если всплеск активности в Википедии на фарси совпадали с перекосами в https запросах, то считали, что результаты корректны. Также, чтобы избежать искажений из-за временных сбоев в сети, данные накладывались на информацию об атаках, чтобы понять, вызвано ли резкое изменение цифрового следа бомбардировками инфраструктуры и отключением сети. В общем, если вам вдруг когда-нибудь будет нужно посчитать изменение числа людей по регионам за небольшой период, возьмите такой подход на заметку.
Posted Mar 28
Подборка докладов вокруг машинного обучения и ИИ На открытой онлайн-конференции Мапакон 2026 будет заметное количество докладов на темумашинного обученияи искусственного интеллекта в ГИС-сфере. Это большая тема, споры вокруг которой даже и не думают прекращаться. Но за громкими терминами скрываются реальные и прикладные проекты. Если вам интересно, как геоспециалисты работают с машинным обучением, приходите посмотреть и послушать доклады в субботу, 28 марта. Доклады на тему машинного обучения и ИИ на Мапаконе 2026 ⭐️ Анна Созонтова, руководитель группы картографии в Команде Автономного транспорта в Яндексе От лидарного облака до полос движения: ML-картография для автономного транспорта ⭐️ Андрей Пирогов, сооснователь компании «Геоспейс», основатель проекта GISGeo, преподаватель, ГИС-евангелист Искусственный интеллект в топографических работах: мифы и реальность ⭐️ Андрей Чернов, руководитель направления геоданных компании СамИС и Самарского университета Как AI работает с адресами и геоданными в масштабах страны: геокодирование, связывание, обогащение ⭐️ Артём Мазурок, со-основатель компании «aeroleader» Вы находитесь здесь. Как мы сделали Android-приложение и веб-сервис для геодезии с помощью ИИ ⭐️ Сергей Абрамов, старший геоаналитик в WB Веб-картография (и геоаналитика) в эпоху LLM ⭐️ Дмитрий Плотников, заведующий сектором Методов дистанционной оценки состояния и мониторинга используемых земель ИКИ РАН, старший научный сотрудник Спутниковое картографирование тридцатилетней динамики пахотных земель регионов России на основе данных Landsat и методов машинного обучения ⭐️ Андрей Коломацкий, аналитик 2ГИС Про, автор телеграм-канала «online ergo sum» ИИ в геоаналитике: опыт внедрения помощника в 2ГИС Про ⭐️ Игорь Кожелин, генеральный директор космической компании ООО «СР Дата», соорганизатор Всероссийского проекта «Чистый берег» Применение технологий дистанционного зондирования Земли и искусственного интеллекта для решения экологических проблем ⭐️ Рената Зигангирова, аналитик Центра геоданных НИУ ВШЭ От текста новостей к геоданным: алгоритм создания базы данных опасных природных явлений с помощью ChatGPT ⭐️ Мария Эрцеговац, выпускница НИУ ВШЭ «Городское планирование», работает в Habidatum Spatial Algorithms + ML. Как ML усиливает пространственные алгоритмы Список дел: 🟨Зарегистрироваться, чтобы получить ссылки доступа накануне конференции 🟨Посмотреть программу и запланировать свою субботу
Posted Mar 26
🗾FOSS4G 2026 Hiroshima — НУЖНА ВАША ПОДДЕРЖКА! Открытое голосование за доклады на главной конференции по open-source геоаналитике. Мои 2 заявки в деле — и сообщество решает, кто выступит. Голосование до 3 апреля. 🚨Как проголосовать (2 минуты): 1️⃣Перейти по ссылке https://talks.osgeo.org/foss4g-2026/p/voting/signup/ 2️⃣Ввести email 3️⃣Найти мои доклады через Ctrl+F (всего 19 страниц) 4️⃣Поставить "Definitely" 🔎 Что искать: ❤️"Eurostat vs OSM vs Census: Choosing Open Mobility Data for Urban Function Maps". Сравниваю 3 открытых источника мобильности (Eurostat MNO, OSM GPS traces, Census) через Python/PostGIS — какой из них реально работает для анализа городских функций. ❤️"50 Lines of Python: Neighborhood DNA from Overture Maps Places". 53 млн POI из Overture Maps → типология районов за 50 строк кода (DuckDB + HDBSCAN + UMAP). Спасибо всем, кто поддержит! @urban_mash
Posted Mar 19
Открытая ГИС-конференция Мапакон — программа и регистрация 28 марта ждём всех на открытой ГИС-конференции «Мапакон 2026» 😎 Основная ценность конференции — это доклады, и их в этот раз более 60! Чтобы не запутаться и выбрать самые интересные, у нас есть программа конференции🔍 Изучайте её и намечайте, на какие доклады пойти. А на странице конференции эта же программа есть в текстовом виде. В итоговом расписании могут быть небольшие изменения, финальный вариант мы ещё опубликуем накануне Мапакона. Формат и регистрация Чтобы не пропустить событие, обязательно зарегистрируйтесь. Всем участникам за час до начала, утром 28 марта, по электронной почте придёт ссылка-приглашение. По ссылке вы перейдёте на онлайн-пространство конференции и сможете перемещаться по разным трансляциям, чтобы слушать доклады в разных комнатах. 🔼Зарегистрироваться
Posted Mar 15
Навеяно текущими событиями Наверняка, большинство из вас слышали про идею 15-минутного города: это когда в пешей доступности от дома есть все необходимые сервисы и не нужно ехать в центр, чтобы сходить в ресторан или купить платье. Идея стала популярна после ковида, потому что многие офисные служащие стали несколько дней в неделю работать из дома. И тут обоюдный плюс: с одной стороны они все еще могут выйти на ланч или кофе в рабочее время, с другой стороны, снижается нагрузка на общественный транспорт плюс периферия начинает развиваться самостоятельно, не зависимо от центра. И вот на днях мне пришла в голову мысль, что, место, где эта идея, действительно важна и должна развиваться - это Израиль. Пока для всего мира 15-минутный город - это про комфорт жителей и устойчивую городскую среду, в Израиле - это про безопасность. Почему? Потому что каждая война здесь (а их было уже 3 за 2 года) - это еще один Covid, только без масок. Из-за того, что во время обстрелов школы и детсады закрыты, хотя бы один взрослый в семье вынужден сидеть дома. Плюс к ним добавляются те, кто может работать из дома или чья работа закрыта. По оценкам банка Израиля дома остаются порядка 600к человек. Формально ограничений на передвижение нет, но по-факту транспорт ходит редко и не весь, а люди и сами не готовы уходить далеко от дома. Учитывая необходимость в любой момент сворачивать в убежище, люди предпочитают оставаться в своем районе: тут они знают, куда идти, "если что". Наложите на это факт, что большинство уличных бизнесов открыто, (стоять закрытыми очень дорого), и вы получите идеальный спрос на локальную доступность. Правда не в 15 минутах, а в 7-и - столько летит ракета из Ирана в Израиль. Мне стало интересно посмотреть, какому проценту страны доступно разнообразие сервисов. Результат ожидаемый: в Тель-Авиве и окрестностях самый высокий процент - больше 25%, в остальном Израиле в среднем 7%. Но что необычно, связь между доступностью и доходом нелинейная: самая низкая и самая высокая доступности в районах с самым низким доходом. А вот в более богатых районах число сервисов ниже среднего. Если предположить, что доход определяет качество жилья, а в Израиле хорошее жилье означает наличие убежища в квартире, то получаем 4 сценария поведения во время войны: 1. У тебя хорошее жилье с защищенным пространством* и ты почти все время проводишь там, потому что и выйти особо некуда (25% городской территории, из них 7% в Тель-Авиве) 2. Ты проводишь время на районе, и почти не сидишь дома, потому что дом все равно не защищен, а вокруг много общественных пространств и "тусовка" (4% городской территории, из которой 92% в Тель-Авиве!) 3. Тебе совсем не повезло: ты сидишь дома, потому что вокруг нет альтернатив, но во время тревоги ходишь в общественное бомбоубежище (68%!!, из которых только 0.7% в Тель-Авиве) 4. Тебе очень повезло и ты можешь выбирать: сидеть дома или пойти в кафе рядом с домом (2%, из них 33% в Тель-Авиве) Получаем, что trade-off между активностью района и доступной безопасностью на самом деле существует только в Тель-Авиве и в окрестностях, тогда как большая часть страны сидит дома. А дальше они либо достаточно зарабатывают, чтобы квартира была защищенной, либо нет.🤷♀️ Кажется, есть о чем задуматься. P.S. *расчет наличия защищенной комнаты в квартире сделан из предположения, что доход одного члена семьи должен быть хотя бы 10к шекелей в месяц
Posted Feb 25
Оказалось, что начать писать пост после долгого перерыва, так же сложно как и пойти в спортзал, когда 2 месяца там не был) но пора возвращаться к тренировкам постам. Языковые модели в пространственном анализе Мы привыкли, что языковые модели генерируют и помогают сравнивать тексты, а также переводят с одного языка на другой. Но оказалось, что их можно применять и в пространственном анализе. Для своего PhD я использовала базовую модель NLP - Word2Vec, поэтому пишу на ее примере. Идея Задача модели Word2Vec находить семантически схожие с друг другом слова, ориентируясь на контекст - какими словами они окружены в предложении: чем больше у пары слов нашлось одинаковых соседей, тем более похожими друг на друга они окажутся. Каждое слово модель в итоге представляет ввиде вектора (embedding), а похожесть слов выражается через величину угла их векторов. Известный пример, что угол между словами "король" и "королева", такой же как между "мужчина" и "женщина". Причем тут гео В гео-задачах нет предложений, но есть объекты на карте и траектории движения людей И если представить, что локации - это слова, то из них можно составить предложения по одному из следующих правил: 1. собрать список мест в районе и расположить их в 'предложении', учитывая расстояние. Для W2V находится сосед до или после слова не имеет значения, главное, что он близко - поэтому если кафе находится рядом с университетом главное, чтобы они оказались рядом в предложении, и неважно, кто первый (как например тут) 2. взять траектории движения, например такси или просто сигналы одного юзера и упорядочить по времени все места, где он был в течение дня( как например тут) И тогда модель будет считать близкими те места, у которых одинаковый пространственный контекст или которые посещаются в похожих маршрутах, например между работой и домом. Интересно, что модель, ничего не зная о географической дистанции между локациями, в целом очень точно определяет, кто находится ближе, кто дальше друг от друга. Какиспользуют W2V в геозадачах Про то как я использовала W2V в своем PhD, напишу в следующем посте, а тут примеры из других исследований. 1. Определить функцию места Мы смотрим на карту и видим два, на первый взгляд, похожих кафе, расположенных в спальнике. Но если мы добавим к ним "контекст" ввиде траекторий жителей, то узнаем, что одно кафе посещается между детским садом/школой и домом, а другое между домом и работой. 2. Поиск невидимых барьеров Хотя в целом близкие физически объекты будут близки и семантически, случаются исключения. Такие аномалии позволяют найти локации, между которыми несмотря на их близость нет перемещений людей (из-за наличия трассы между, социальной дистанции итд) 3. Функциональные кластеры Обратная цель к предыдущей задаче - исследователи ищут функциональные кластеры, то есть группы мест с похожим использованием и набором мест, чтобы улучшить городское планирование Получается, что город — это такой огромный текст, правда не в 1-d, а в 2-d. И языковые модели могут также его читать, как и слова: находить взаимосвязи, учиться понимать контекст. W2V - это базовая модель NLP, учитывая прогресс в этой области, очевидно, что пока затронута только "верхушка", но кажется, что потенциала много. У кого работает - ссылка на NotebookLM со всеми источниками
Posted Feb 13
Аналитика локации от Vertix AI, которую мы заслужили..
Posted Feb 11
Друзья, школа урбанистики и городских исследований «Города» открыла продажи онлайн-курсов! 🔥 Приглашаем вас на сайт, выбирайте занятия по душе, а начнём учёбу мы уже в марте. Каждый курс преподаватели составляли именно для слушателей нашего проекта, как опытных, так и начинающих свой путь урбанистов. Будет увлекательно и интересно, с авторскими лекциями, практическими заданиями, чатами курсов и общим нетворк-чатом Школы! Программа пятого потока Школы: ⚫️курс Петра Иванова «Российская мысль о городе конца XX – начала XXI века»: https://gorodaschool.ru/russian-city-thoughts-course ⚫️курс Александра Антонова «Пространственное планирование»: https://gorodaschool.ru/city-space-planning-course ⚫️курс Юлии Родиковой «Аналитика в урбанистике»: https://gorodaschool.ru/urban-analytics-course ⚫️курс Егора Мулеева «Транспортные исследования: между наукой и интуицией»: https://gorodaschool.ru/transport-research-course ⚫️курс Игоря Стася Urban History: https://gorodaschool.ru/urban-history-course ⚫️курс Дмитрия Лисицина «Социальное проектирование в малых городах»: https://gorodaschool.ru/small-cities-planning-course ⚫️Медленный книжный клуб «Читающие города» Марии Быстровой / читаем «Сообщество как городская практика» Тальи Блокланд: https://gorodaschool.ru/book-club
Posted Jan 21
Вчера проект «Если быть точным» опубликовали новый набор данных со всеми населенными пунктами России. Внутри: 🔺155 тысяч населенных пунктов, а также муниципалитеты (первого и второго уровней) и регионы, к которым они относятся; 🔺Численность населения по итогам переписи 2021 года; 🔺Национальный состав в разбивке по 194 категориям с учетом того, что в переписи человек мог указать несколько этнических принадлежностей; 🔺Географические координаты населенных пунктов.
Posted Jan 20
Привет! Меня зовут Глеб, мы в команде геоаналитики ПВЗ Вайлдберриз ищем геоаналитика. Одна из главных целей нашей команды - добиться того, чтобы ПВЗ было столько, сколько нужно и стояли они там, где нужно, и делаем это через улучшение данных, ответы на вопросы бизнеса, построение моделей, изменение алгоритмов, по которым работают зоны на карте map.wb.ru - на неё приходят наши партнёры чтобы понять, где лучше открыться и прикинуть, сколько на ПВЗ в конкретной локации можно заработать. Развитием всех описанных частей и предстоит заниматься: для нас важно, чтобы вы хотели работать, имели уровень не ниже middle (3+ года опыта) в аналитическом и пространственном питоне (pandas & geopandas), SQL (PostGIS), имеете опыт построения ML моделей для задач бизнеса и пространственной аналитики (знаете про QGIS и пространственные операции с геометрией). ссылка на вакансию - тут (https://hh.ru/vacancy/129438376) Все требования в вакансии - актуальные (хотим видеться в офисе в Москве хотя бы 1-2 раза в неделю). для прямого референса пишите моей коллеге @annetta_pik
Posted Jan 19
Recently the most significant open buildings dataset was released by Technical University of Munich— “#GlobalBuildingAtlas”. It outperforms all other datasets (Google Open buildings, 3D-#GlobBFP) in the number of buildings (2.75 billion) and, in our estimation, also outperforms them in data quality. As we at GeoAlert have been working on the benchmarks for our #Mapflow buildings model we used the opportunity to test the open data and contribute our validation to the work of the community. We focused this testing on the China urban area as there is a lack of validation data available for China. In addition, we have published all the benchmarks, notebooks, and the QGIS project in the repository for easy visualization and reproduction. It's been a while since we posted any research works on our blog. Read more. 😀