Критерии отбора районов и МО для ювелирной мастерской

Двухэтапная методология выбора локации в Санкт-Петербурге: критерии, формулы, шкалы оценки и ограничения модели.

Методика выбора локации в Санкт‑Петербурге строится по принципу:

  1. ранжирование районов (только по районным данным),
  2. ранжирование муниципальных округов (МО) внутри выбранных районов,
  3. полевые/качественные проверки и финмодель для короткого списка.

Ключевой принцип: не смешивать показатели разных уровней агрегирования в одном интегральном рейтинге района.
МО‑уровень используется на этапе 2 и не участвует в районном скоринге.

Термины и допущения

  • Район – административный район Санкт‑Петербурга (уровень “district”).
  • МО – внутригородское муниципальное образование / муниципальный округ (уровень “mo”).
  • Работающая мастерская / организация – запись, отмеченная как действующая (is_work = 1) в наборе организаций.

Про нули (0 мастерских): вместо “средней оценки” используется сглаживание в формулах (+ 0.5) и обязательная ручная валидация (карты/поиск) для финального shortlist.

Источники данных (CSV, используемые в расчётах)

Районный уровень:

  • district_density_stats.csv – население района, число работающих мастерских, производные показатели конкуренции.
  • organisations_with_ids.csv (+ агрегация) и/или organisations-by-district.csv – всего организаций и работающих для расчёта “выживаемости”.
  • population-age-sex-structure-2024.csv – возрастные когорты для оценки ЦА 30–65.
  • working-age-population-female-2024.csv (+ working-age-population-both-2024.csv) – численность женщин трудоспособного возраста.
  • people-by-district-timeline.csv – динамика населения 2018–2025.
  • average_salary_by_district.csv – средняя зарплата по районам.
  • commissioning-housing-by-district.csv – ввод жилья (используется сумма за 2021–2023).

МО‑уровень:

  • mo_density_stats.csv – население МО и число работающих мастерских (для конкурентного давления внутри района).
  • people-by-mo-2025.csv и/или people-by-mo-timeline.csv – население МО (если нужно уточнять/валидировать).
  • organisations-by-district-and-mo.csv / organisations-by-mo.csv – организации по МО (по необходимости для валидации).

Этап 1 – Рейтинг районов (районные критерии)

1. Группа: Конкурентная среда (район)

1.1. Плотность конкурентов (население на одну работающую мастерскую)

Показывает конкурентное давление: сколько жителей приходится на одну работающую мастерскую. Чем выше значение, тем ниже конкуренция.

Формула (со сглаживанием нулей):
people_per_workshop = population / (workshops_working + 0.5)

Источник данных: district_density_stats.csv

Шкала оценки (по people_per_workshop):

  • больше 40 000 – 3 балла
  • 25 000–40 000 – 2 балла
  • меньше 25 000 – 1 балл

Вес: 20%

Отраслевой контекст. Конкурентное давление – один из ключевых факторов в индустриальных моделях site selection (Buxton, Kalibrate, GrowthFactor). Крупные сети оценивают не только количество конкурентов, но и их долю рынка, сегментацию (прямые vs косвенные), а также «перехватывающих» конкурентов на пути клиента. Для текущей модели доступен только агрегированный показатель – количество работающих мастерских на население. При появлении данных о выручке конкурентов или об их сегментации (ремонтные мастерские / сетевые ювелирные / ломбарды) рекомендуется детализировать этот критерий.

Пороги 40 000 / 25 000 выбраны с помощью LLM. Без бенчмарка по выручке успешных мастерских калибровка невозможна; в будущем рекомендуется валидировать пороги аналоговым методом (по фактической выручке 3–5 собственных точек).

1.2. Коэффициент выживаемости бизнеса

Доля работающих организаций от общего числа. Высокое значение – признак более устойчивого рынка.

Формула:
survival_rate = working_orgs / total_orgs - где working_orgs – количество организаций с is_work = 1,

total_orgs – общее количество организаций в районе.

Источник данных:

organisations_with_ids.csv (агрегация до района) и/или organisations-by-district.csv

Шкала оценки:

  • больше 0.70 – 3 балла
  • 0.60–0.70 – 2 балла меньше 0.60 – 1 балл

Вес:

5%

Ограничение: малая выборка.

Выживаемость рассчитывается по ювелирным мастерским – от 1 до 39 организаций на район (всего 354 на город). При таких объёмах закрытие 2–3 точек может сместить показатель на 10–15%, что отражает не системные свойства района, а индивидуальные обстоятельства (выход мастера на пенсию, переезд). Крупные компании (Starbucks, McDonald’s) используют общую статистику по выживаемости малого бизнеса из реестров ФНС/ЕГРЮЛ за 3–5 лет, либо vacancy rate (долю пустующих коммерческих площадей), что лучше отражает здоровье бизнес-среды.

Рекомендация: При появлении данных о vacancy rate или об общей бизнес-выживаемости по районам – заменить текущий критерий. До этого вес снижен до 5% для ограничения влияния шума.

2. Группа: Демография и целевая аудитория (район)

2.1. Численность целевой аудитории (30–65 лет)

Оценивает абсолютный размер рынка в ключевом возрастном диапазоне.

Формула (строго по данным 2024):

target_30_65 = sum(30–34, 35–39, 40–44, 45–49, 50–54, 55–59, 60–64)
(если в данных нет отдельного “65”, используется диапазон 30–64 как воспроизводимое приближение)

Источник данных:

population-age-sex-structure-2024.csv

Шкала оценки:

  • больше 200 000 – 3 балла
  • 100 000–200 000 – 2 балла
  • меньше 100 000 – 1 балл

Вес:

15%

Ограничение: абсолютный размер vs плотность.

Критерий использует абсолютную численность ЦА в районе, а не плотность ЦА в радиусе торговой зоны (trade area). Это означает, что крупные по населению районы (Приморский – 715 тыс., Невский – 557 тыс.) системно получают преимущество. В индустрии (Placer.ai, ESRI Business Analyst) стандартом является оценка плотности ЦА в зоне 15–20 минут drive-time от конкретного адреса.

Для текущего этапа (грубый отсев 18 → 8 районов) абсолютный размер допустим, т.к. районы СПб сопоставимы по площади застроенной части. Для этапа 3 (shortlist конкретных адресов) рекомендуется перейти к drive-time анализу.

2.2. Доля женской аудитории трудоспособного возраста

Женская аудитория чаще выступает инициатором обращения и может приносить несколько изделий за визит. Критерий оценивает относительный потенциал повторных обращений.

Формула (как в исходной методике):

female_working_share = female_working_age / total_population

Источники данных:

  • численность женщин трудоспособного возраста: working-age-population-female-2024.csv
  • общая численность населения (год должен совпадать с выбранным базовым годом расчёта): people-by-district-timeline.csv

Шкала оценки (чтобы избежать произвольных порогов):

  • 3 балла – верхняя треть районов по female_working_share (≥ 67‑й перцентиль)
  • 2 балла – средняя треть (между 33‑м и 67‑м перцентилями)
  • 1 балл – нижняя треть (≤ 33‑й перцентиль)

Вес:

5%

2.3. Динамика роста населения (2018–2025)

Растущие районы расширяют клиентскую базу; отрицательная динамика – риск снижения спроса.

Формула:

growth_2018_2025 = (pop_2025 - pop_2018) / pop_2018

Источник данных:

people-by-district-timeline.csv

Шкала оценки:

  • больше +10% – 3 балла
  • 0% … +10% – 2 балла
  • меньше 0% – 1 балл

Вес:

10%

3. Группа: Платёжеспособность (район)

3.1. Средняя заработная плата в районе

Доходы населения влияют на готовность оплачивать услуги ремонта/обслуживания ювелирных изделий.

Источник данных:

average_salary_by_district.csv

Шкала оценки:

  • больше 140 000 ₽ – 3 балла
  • 120 000–140 000 ₽ – 2 балла
  • меньше 120 000 ₽ – 1 балл

Вес:

10%

Ограничение: зарплата работающих ≠ доход жителей. Средняя заработная плата по району отражает доходы людей, работающих на предприятиях района, а не проживающих в нём. Центральный район (159 976 ₽) получает высокую оценку из-за концентрации офисов, хотя значительная часть работающих живёт в других районах и обслуживаться будет ближе к дому. Аналогично, Красносельский (108 531 ₽) занижен, хотя его жители могут работать в высокооплачиваемых районах.

Индустриальный стандарт (Starbucks, ESRI) – медианный доход домохозяйства (household income). При появлении данных о доходах домохозяйств или средней стоимости кв. м жилья рекомендуется заменить текущий показатель.

3.2. Косвенные индикаторы благосостояния – не считается (нет данных). Если появятся данные, возвращается в расчёт отдельным критерием.

4. Группа: Инфраструктура и потенциал роста (район)

4.1. Транспортная доступность – не считается (нет данных).

4.2. Парковочная инфраструктура – не считается (нет данных).

4.3. Объём ввода нового жилья (2021–2023)

Строительство нового жилья приводит к притоку жителей и росту потенциального спроса.

Показатель:

housing_2021_2023 = sum(2021, 2022, 2023)

Источник данных:

commissioning-housing-by-district.csv (значения в тыс. кв. м)

Шкала оценки (пороги в тыс. кв. м):

  • больше 500 – 3 балла
  • 200–500 – 2 балла
  • меньше 200 – 1 балл

Единицы измерения.

Данные в CSV указаны в тыс. кв. м. Пороги сравниваются напрямую с суммой: Приморский = 2 478.7 тыс. кв. м → 3 балла. Если один из годов содержит нечисловое значение (символ ), используется сумма по доступным годам.

Вес:

5%

5. Формула районного рейтинга (с корректной обработкой отсутствующих критериев)

Чтобы “нет данных” не превращалось в автоматическую “среднюю оценку”, районный рейтинг считается по доступным критериям с нормированием по сумме использованных весов:

R_district = Σ(Bi × Wi) / Σ(Wi)

  • Bi – балл 1/2/3 по критерию,
  • Wi – вес критерия (в процентах),
  • сумма берётся только по критериям, которые реально посчитаны.

Дополнительно фиксируется покрытие: coverage = Σ(Wi_used) / Σ(Wi_planned)

Интерпретация coverage. При текущих данных coverage = 70% (для большинства районов). Отсутствуют критерии, которые в индустриальных моделях site selection занимают 20–25% веса:

  • пешеходный / автомобильный трафик – самый значимый пробел; все крупные сети (Starbucks, McDonald’s, X5) включают foot traffic и vehicle counts в топ-3 факторов;
  • транспортная доступность – расстояние до метро, остановок, основных магистралей;
  • co-tenancy – близость к комплементарным бизнесам (свадебные салоны, бутики, ТЦ).

Рейтинг с coverage 70% достаточен для грубого отсева (18 → 8 районов), но недостаточен для финального решения. Этап 3 (полевые проверки) обязателен для компенсации недоступных факторов.

6. Рекомендации по отбору районов

  • базовый фильтр: R_district ≥ 2.0
  • практичный вариант: взять топ‑N районов (например 5–8) по R_district и перейти к этапу 2.

Этап 2 – Рейтинг МО внутри выбранных районов (МО‑уровень)

На этом этапе оцениваются муниципальные округа только внутри районов, прошедших этап 1.

2.1. Конкурентное давление на уровне МО (основной показатель)

Формула (со сглаживанием нулей):

mo_people_per_workshop = mo_population / (mo_workshops_working + 0.5)

Источник данных:

mo_density_stats.csv

Рекомендованный фильтр по масштабу рынка:

  • МО с mo_population < 30 000 рассматриваются как низкий приоритет (попадают в shortlist только при сильных локальных причинах).

Сценарий ранжирования МО (без двойного учёта):

  • первичная сортировка по mo_people_per_workshop (по убыванию конкуренции / по возрастанию давления: чем выше показатель, тем лучше),
  • вторичная сортировка по mo_population (чем больше рынок, тем лучше).

2.2. «Белые пятна» (индикатор для приоритизации, не отдельный вес)

Индикатор нужен, чтобы подсветить МО с крупным населением и отсутствием конкурентов, но не дублировать основной показатель 2.1.

Правило‑флаг:

  • mo_workshops_working = 0 и mo_population > 50 000высокий приоритет проверки
  • mo_workshops_working ∈ {0,1} и 30 000 ≤ mo_population ≤ 50 000средний приоритет
  • иначе → обычный режим

Важно:

флаг означает “проверить внимательнее”, а не автоматически выбрать МО. Для таких МО обязательна ручная проверка конкурентов (поисковые карты/каталоги), потому что ноль часто связан с неполнотой классификации/границами.

Этап 3 – Полевые и качественные проверки (короткий список)

Этап 3 применяется к топ‑МО/локациям после этапа 2 и не входит в автоматический CSV‑скоринг, пока нет надежных источников.

Примеры факторов:

  • безопасность / криминогенная обстановка,
  • коммерческая активность улицы (арендаторы, трафик),
  • наличие парковки и удобство подъезда,
  • качество конкретного помещения (первая линия, площадь 15–40 м², витрина, инженерные условия),
  • стоимость аренды и условия договора.

Результат этапа 3: shortlist 3–5 конкретных адресов для финансового моделирования.

Этап 4 – Финансовое моделирование

Для shortlist‑локаций строится финмодель с одинаковыми допущениями (CAPEX/OPEX, аренда, трафик, конверсия, средний чек, сезонность) и выбирается вариант с лучшим профилем:

  • ожидаемая прибыль,
  • срок окупаемости,
  • чувствительность к аренде/трафику.

Приложение A – Сводка критериев по этапам

Этап 1 (районы): критерии, которые считаются из текущих CSV

  • 1.1 Плотность конкурентов – 20%
  • 1.2 Выживаемость – 5%
  • 2.1 ЦА 30–65 – 15%
  • 2.2 Женщины труд. возраста – 5%
  • 2.3 Рост населения 2018–2025 – 10%
  • 3.1 Зарплата – 10%
  • 4.3 Ввод жилья – 5%

Сумма доступных весов: 70%.

Критерии, которые не считаются (пока нет данных): 3.2, 4.1, 4.2.

Этап 2 (МО): критерии и правила

  • 2.1 МО‑плотность конкурентов (основной численный показатель)
  • 2.2 «Белые пятна» – флаг приоритета проверки (без отдельного веса)
← Назад к проектам