Критерии отбора районов и МО для ювелирной мастерской
Двухэтапная методология выбора локации в Санкт-Петербурге: критерии, формулы, шкалы оценки и ограничения модели.
Методика выбора локации в Санкт‑Петербурге строится по принципу:
- ранжирование районов (только по районным данным),
- ранжирование муниципальных округов (МО) внутри выбранных районов,
- полевые/качественные проверки и финмодель для короткого списка.
Ключевой принцип: не смешивать показатели разных уровней агрегирования в одном интегральном рейтинге района.
МО‑уровень используется на этапе 2 и не участвует в районном скоринге.
Термины и допущения
- Район – административный район Санкт‑Петербурга (уровень “district”).
- МО – внутригородское муниципальное образование / муниципальный округ (уровень “mo”).
- Работающая мастерская / организация – запись, отмеченная как действующая (
is_work = 1) в наборе организаций.
Про нули (0 мастерских): вместо “средней оценки” используется сглаживание в формулах (+ 0.5) и обязательная ручная валидация (карты/поиск) для финального shortlist.
Источники данных (CSV, используемые в расчётах)
Районный уровень:
district_density_stats.csv– население района, число работающих мастерских, производные показатели конкуренции.organisations_with_ids.csv(+ агрегация) и/илиorganisations-by-district.csv– всего организаций и работающих для расчёта “выживаемости”.population-age-sex-structure-2024.csv– возрастные когорты для оценки ЦА 30–65.working-age-population-female-2024.csv(+working-age-population-both-2024.csv) – численность женщин трудоспособного возраста.people-by-district-timeline.csv– динамика населения 2018–2025.average_salary_by_district.csv– средняя зарплата по районам.commissioning-housing-by-district.csv– ввод жилья (используется сумма за 2021–2023).
МО‑уровень:
mo_density_stats.csv– население МО и число работающих мастерских (для конкурентного давления внутри района).people-by-mo-2025.csvи/илиpeople-by-mo-timeline.csv– население МО (если нужно уточнять/валидировать).organisations-by-district-and-mo.csv/organisations-by-mo.csv– организации по МО (по необходимости для валидации).
Этап 1 – Рейтинг районов (районные критерии)
1. Группа: Конкурентная среда (район)
1.1. Плотность конкурентов (население на одну работающую мастерскую)
Показывает конкурентное давление: сколько жителей приходится на одну работающую мастерскую. Чем выше значение, тем ниже конкуренция.
Формула (со сглаживанием нулей):
people_per_workshop = population / (workshops_working + 0.5)
Источник данных: district_density_stats.csv
Шкала оценки (по people_per_workshop):
- больше 40 000 – 3 балла
- 25 000–40 000 – 2 балла
- меньше 25 000 – 1 балл
Вес: 20%
Отраслевой контекст. Конкурентное давление – один из ключевых факторов в индустриальных моделях site selection (Buxton, Kalibrate, GrowthFactor). Крупные сети оценивают не только количество конкурентов, но и их долю рынка, сегментацию (прямые vs косвенные), а также «перехватывающих» конкурентов на пути клиента. Для текущей модели доступен только агрегированный показатель – количество работающих мастерских на население. При появлении данных о выручке конкурентов или об их сегментации (ремонтные мастерские / сетевые ювелирные / ломбарды) рекомендуется детализировать этот критерий.
Пороги 40 000 / 25 000 выбраны с помощью LLM. Без бенчмарка по выручке успешных мастерских калибровка невозможна; в будущем рекомендуется валидировать пороги аналоговым методом (по фактической выручке 3–5 собственных точек).
1.2. Коэффициент выживаемости бизнеса
Доля работающих организаций от общего числа. Высокое значение – признак более устойчивого рынка.
Формула:
survival_rate = working_orgs / total_orgs - где working_orgs – количество организаций с is_work = 1,
total_orgs – общее количество организаций в районе.
Источник данных:
organisations_with_ids.csv (агрегация до района) и/или organisations-by-district.csv
Шкала оценки:
- больше 0.70 – 3 балла
- 0.60–0.70 – 2 балла меньше 0.60 – 1 балл
Вес:
5%
Ограничение: малая выборка.
Выживаемость рассчитывается по ювелирным мастерским – от 1 до 39 организаций на район (всего 354 на город). При таких объёмах закрытие 2–3 точек может сместить показатель на 10–15%, что отражает не системные свойства района, а индивидуальные обстоятельства (выход мастера на пенсию, переезд). Крупные компании (Starbucks, McDonald’s) используют общую статистику по выживаемости малого бизнеса из реестров ФНС/ЕГРЮЛ за 3–5 лет, либо vacancy rate (долю пустующих коммерческих площадей), что лучше отражает здоровье бизнес-среды.
Рекомендация: При появлении данных о vacancy rate или об общей бизнес-выживаемости по районам – заменить текущий критерий. До этого вес снижен до 5% для ограничения влияния шума.
2. Группа: Демография и целевая аудитория (район)
2.1. Численность целевой аудитории (30–65 лет)
Оценивает абсолютный размер рынка в ключевом возрастном диапазоне.
Формула (строго по данным 2024):
target_30_65 = sum(30–34, 35–39, 40–44, 45–49, 50–54, 55–59, 60–64)
(если в данных нет отдельного “65”, используется диапазон 30–64 как воспроизводимое приближение)
Источник данных:
population-age-sex-structure-2024.csv
Шкала оценки:
- больше 200 000 – 3 балла
- 100 000–200 000 – 2 балла
- меньше 100 000 – 1 балл
Вес:
15%
Ограничение: абсолютный размер vs плотность.
Критерий использует абсолютную численность ЦА в районе, а не плотность ЦА в радиусе торговой зоны (trade area). Это означает, что крупные по населению районы (Приморский – 715 тыс., Невский – 557 тыс.) системно получают преимущество. В индустрии (Placer.ai, ESRI Business Analyst) стандартом является оценка плотности ЦА в зоне 15–20 минут drive-time от конкретного адреса.
Для текущего этапа (грубый отсев 18 → 8 районов) абсолютный размер допустим, т.к. районы СПб сопоставимы по площади застроенной части. Для этапа 3 (shortlist конкретных адресов) рекомендуется перейти к drive-time анализу.
2.2. Доля женской аудитории трудоспособного возраста
Женская аудитория чаще выступает инициатором обращения и может приносить несколько изделий за визит. Критерий оценивает относительный потенциал повторных обращений.
Формула (как в исходной методике):
female_working_share = female_working_age / total_population
Источники данных:
- численность женщин трудоспособного возраста:
working-age-population-female-2024.csv - общая численность населения (год должен совпадать с выбранным базовым годом расчёта):
people-by-district-timeline.csv
Шкала оценки (чтобы избежать произвольных порогов):
- 3 балла – верхняя треть районов по
female_working_share(≥ 67‑й перцентиль) - 2 балла – средняя треть (между 33‑м и 67‑м перцентилями)
- 1 балл – нижняя треть (≤ 33‑й перцентиль)
Вес:
5%
2.3. Динамика роста населения (2018–2025)
Растущие районы расширяют клиентскую базу; отрицательная динамика – риск снижения спроса.
Формула:
growth_2018_2025 = (pop_2025 - pop_2018) / pop_2018
Источник данных:
people-by-district-timeline.csv
Шкала оценки:
- больше +10% – 3 балла
- 0% … +10% – 2 балла
- меньше 0% – 1 балл
Вес:
10%
3. Группа: Платёжеспособность (район)
3.1. Средняя заработная плата в районе
Доходы населения влияют на готовность оплачивать услуги ремонта/обслуживания ювелирных изделий.
Источник данных:
average_salary_by_district.csv
Шкала оценки:
- больше 140 000 ₽ – 3 балла
- 120 000–140 000 ₽ – 2 балла
- меньше 120 000 ₽ – 1 балл
Вес:
10%
Ограничение: зарплата работающих ≠ доход жителей. Средняя заработная плата по району отражает доходы людей, работающих на предприятиях района, а не проживающих в нём. Центральный район (159 976 ₽) получает высокую оценку из-за концентрации офисов, хотя значительная часть работающих живёт в других районах и обслуживаться будет ближе к дому. Аналогично, Красносельский (108 531 ₽) занижен, хотя его жители могут работать в высокооплачиваемых районах.
Индустриальный стандарт (Starbucks, ESRI) – медианный доход домохозяйства (household income). При появлении данных о доходах домохозяйств или средней стоимости кв. м жилья рекомендуется заменить текущий показатель.
3.2. Косвенные индикаторы благосостояния – не считается (нет данных). Если появятся данные, возвращается в расчёт отдельным критерием.
4. Группа: Инфраструктура и потенциал роста (район)
4.1. Транспортная доступность – не считается (нет данных).
4.2. Парковочная инфраструктура – не считается (нет данных).
4.3. Объём ввода нового жилья (2021–2023)
Строительство нового жилья приводит к притоку жителей и росту потенциального спроса.
Показатель:
housing_2021_2023 = sum(2021, 2022, 2023)
Источник данных:
commissioning-housing-by-district.csv (значения в тыс. кв. м)
Шкала оценки (пороги в тыс. кв. м):
- больше 500 – 3 балла
- 200–500 – 2 балла
- меньше 200 – 1 балл
Единицы измерения.
Данные в CSV указаны в тыс. кв. м. Пороги сравниваются напрямую с суммой: Приморский = 2 478.7 тыс. кв. м → 3 балла. Если один из годов содержит нечисловое значение (символ –), используется сумма по доступным годам.
Вес:
5%
5. Формула районного рейтинга (с корректной обработкой отсутствующих критериев)
Чтобы “нет данных” не превращалось в автоматическую “среднюю оценку”, районный рейтинг считается по доступным критериям с нормированием по сумме использованных весов:
R_district = Σ(Bi × Wi) / Σ(Wi)
Bi– балл 1/2/3 по критерию,Wi– вес критерия (в процентах),- сумма берётся только по критериям, которые реально посчитаны.
Дополнительно фиксируется покрытие: coverage = Σ(Wi_used) / Σ(Wi_planned)
Интерпретация coverage. При текущих данных coverage = 70% (для большинства районов). Отсутствуют критерии, которые в индустриальных моделях site selection занимают 20–25% веса:
- пешеходный / автомобильный трафик – самый значимый пробел; все крупные сети (Starbucks, McDonald’s, X5) включают foot traffic и vehicle counts в топ-3 факторов;
- транспортная доступность – расстояние до метро, остановок, основных магистралей;
- co-tenancy – близость к комплементарным бизнесам (свадебные салоны, бутики, ТЦ).
Рейтинг с coverage 70% достаточен для грубого отсева (18 → 8 районов), но недостаточен для финального решения. Этап 3 (полевые проверки) обязателен для компенсации недоступных факторов.
6. Рекомендации по отбору районов
- базовый фильтр:
R_district ≥ 2.0 - практичный вариант: взять топ‑N районов (например 5–8) по
R_districtи перейти к этапу 2.
Этап 2 – Рейтинг МО внутри выбранных районов (МО‑уровень)
На этом этапе оцениваются муниципальные округа только внутри районов, прошедших этап 1.
2.1. Конкурентное давление на уровне МО (основной показатель)
Формула (со сглаживанием нулей):
mo_people_per_workshop = mo_population / (mo_workshops_working + 0.5)
Источник данных:
mo_density_stats.csv
Рекомендованный фильтр по масштабу рынка:
- МО с
mo_population < 30 000рассматриваются как низкий приоритет (попадают в shortlist только при сильных локальных причинах).
Сценарий ранжирования МО (без двойного учёта):
- первичная сортировка по
mo_people_per_workshop(по убыванию конкуренции / по возрастанию давления: чем выше показатель, тем лучше), - вторичная сортировка по
mo_population(чем больше рынок, тем лучше).
2.2. «Белые пятна» (индикатор для приоритизации, не отдельный вес)
Индикатор нужен, чтобы подсветить МО с крупным населением и отсутствием конкурентов, но не дублировать основной показатель 2.1.
Правило‑флаг:
mo_workshops_working = 0иmo_population > 50 000→ высокий приоритет проверкиmo_workshops_working ∈ {0,1}и30 000 ≤ mo_population ≤ 50 000→ средний приоритет- иначе → обычный режим
Важно:
флаг означает “проверить внимательнее”, а не автоматически выбрать МО. Для таких МО обязательна ручная проверка конкурентов (поисковые карты/каталоги), потому что ноль часто связан с неполнотой классификации/границами.
Этап 3 – Полевые и качественные проверки (короткий список)
Этап 3 применяется к топ‑МО/локациям после этапа 2 и не входит в автоматический CSV‑скоринг, пока нет надежных источников.
Примеры факторов:
- безопасность / криминогенная обстановка,
- коммерческая активность улицы (арендаторы, трафик),
- наличие парковки и удобство подъезда,
- качество конкретного помещения (первая линия, площадь 15–40 м², витрина, инженерные условия),
- стоимость аренды и условия договора.
Результат этапа 3: shortlist 3–5 конкретных адресов для финансового моделирования.
Этап 4 – Финансовое моделирование
Для shortlist‑локаций строится финмодель с одинаковыми допущениями (CAPEX/OPEX, аренда, трафик, конверсия, средний чек, сезонность) и выбирается вариант с лучшим профилем:
- ожидаемая прибыль,
- срок окупаемости,
- чувствительность к аренде/трафику.
Приложение A – Сводка критериев по этапам
Этап 1 (районы): критерии, которые считаются из текущих CSV
- 1.1 Плотность конкурентов – 20%
- 1.2 Выживаемость – 5%
- 2.1 ЦА 30–65 – 15%
- 2.2 Женщины труд. возраста – 5%
- 2.3 Рост населения 2018–2025 – 10%
- 3.1 Зарплата – 10%
- 4.3 Ввод жилья – 5%
Сумма доступных весов: 70%.
Критерии, которые не считаются (пока нет данных): 3.2, 4.1, 4.2.
Этап 2 (МО): критерии и правила
- 2.1 МО‑плотность конкурентов (основной численный показатель)
- 2.2 «Белые пятна» – флаг приоритета проверки (без отдельного веса)