Process Mining может успешно применяться в не самых очевидных областях, например, в профессиональном спорте. Особенно, если речь идёт про виды с высокой результативностью, как баскетбол. Финальная серия Национальной Баскетбольной Ассоциации (NBA) 2024 года между Даллас Маверикс и Бостон Селтикс стала объектом анализа. В рамках исследования каждый матч рассматривается как процесс, состоящий из цепочек игровых событий.
Подготовительный этап
Задача команды проекта заключалась не в простом описании собранной статистики (% попаданий, % точных трёхочковых бросков, число подборов, потерь и так далее), а в восстановлении реального сценария и хода игровых действий. Так, анализируя структуру конкретных эпизодов через призму событийных логов, можно выявить характерные игровые паттерны, определить «узкие места» и найти максимально эффективные, но редко используемые тактики и комбинации.
В качестве исходных данных использовались play-by-play отчёты матчей – технико-тактические записи, фиксирующие каждое игровое действие (пас, бросок, потеря, подбор, фол и т.д) с точным временем и контекстом. Структуризация для Process Mining строилась следующим образом:
- case_id: уникальная идентификация эпизода (матч+четверть+команда), позволяющая моделировать процессы с привязкой к временным отрезкам;
- activity_id: тип события (бросок с игры, штрафной, фол, тайм-аут и др.);
- timestamp: точный тайминг в формате mm:ss;
- resource_id: игрок, совершающий действие;
- player_tem: клуб;
- teams_play: владение команды.
В результате был сформирован событийный лог, содержащий более 5 000 событий по итогам финальной серии.
На первом этапе анализа были построены точные модели процесса с детальной логикой решения для каждой команды в каждой четверти матча с использованием алгоритма Inductive Miner. Визуализировав данные, команда проекта получила следующие гипотезы:
- доминирование конкретных цепочек в игровых сценариях: пас – бросок – подбор – новый пас;
- наличие чётких развилок между быстрыми (до 8 секунд) и позиционными (более 15 секунд) атаками;
- обнаружение значимых различий между 1 и 4 четвертью – в концовке игр команды стремились снижать долю передач и ускорять темп, выбирая рискованные, но потенциально более результативные броски (пример – дальний трёхочковый бросок при наличии сопротивления).
Реализация
Для более глубокого анализа были построены частотные графы «топ-1» и «топ-5» вариантов процессов. В первом тире для победившей команды доминировала простая структура нападения с минимумом звеньев: передача – бросок – очки/подбор. Это говорит о чётком следовании выбранному стилю и попытках выстроить наиболее эффективную систему.
Реже встречались и длинные цепочки, включавшие больше дриблинга, дополнительных пасов и заслонов после владений, завершившихся промахом. Вывод: такая структура нападения – результат вынужденных перестроений под соперника, что подтверждает доминирование подобной тактики именно у проигравшей стороны.
В дальнейшем реальные данные сравнивались с целевыми показателями, подготовленными на основе тренерских планов. Победитель соответствовал KPI в 82% случаев, а проигравший – только на уровне 67%.
В конечном итоге, в ходе реализации проекта зафиксировали три ключевых инсайта:
- «узкие места» в переходах к обороне.
Анализ показал, что проигравшая команда часто допускала фолы при попытках замедлить быстрые атаки, что приводило к штрафным и потере темпа;
- эффективность коротких цепочек.
Побеждающая команда чаще завершала атаки после 2-3 действий без лишних передач, что минимизировало потери;
- проблемы с ротацией и накопленной усталостью.
В четвёртых четвертях частота ошибок и потерь резко возрастала, особенно после смены состава.
Ценность для спортивной аналитики
В отличие от классической статистики (процент попадания и т.д.), Process Mining дал структуру и последовательность: можно не просто видеть, сколько подборов было, но и понимать их место в игровом контексте. Это позволило:
- картрировать паттерны атак и защитных взаимодействий;
- выявить слабые места в переходах между фазами атаки и защиты;
- смоделировать возможные изменения плана игры для устранения выявленных «узких мест».
Заключение
Применение Process Mining к спортивным событиям демонстрирует универсальность этого подхода. Из, на первый взгляд, хаотичных событий формируется прозрачная модель процессов – с чёткими точками для улучшения и измеримыми эффектами.