Манифест Process Mining – базовый документ в области процессной аналитики, содержащий основные руководящие принципы технологии. Цель манифеста – развитие process mining как нового инструмента совершенствования возможностей контроля, сопровождения и оптимизации операционных бизнес-процессов. Документ адресован управленцам, разработчикам собственного ПО, аналитикам и специалистам в области консалтинга.
Данный манифест создан рабочей группой IEEE по анализу процессов (IEEE Task Force on Process Mining). Оригинальная версия опубликована 7 октября 2011 года. Официальный перевод документа выполнили Константин Голоктеев и Иван Матвеев. Ниже – основные положения манифеста.
Process mining: современное состояние
Началом process mining является журнал событий. Все методы предполагают получение последовательно записанных событий, таких, что каждое событие относится к действию и является частью кейса (т.е. экземпляра). По сути методы process mining позволяют использовать дополнительные атрибуты событий, такие как ресурс, временная отметка события или элементы данных, записанные для события (например, сумма заказа).
Журналы событий могут быть использованы для осуществления трех форм process mining:
- извлечения процесса;
- проверки соответствия – сопоставления существующей модели процесса с журналом событий этого же процесса;
- усовершенствования процесса. В данном случае существующую модель процесса улучшают с использованием информации о реально осуществляемом процессе, зафиксированном в каком-либо журнале событий
Существует несколько стереотипов и мифов, связанных с process mining. Ряд вендоров, аналитиков и ученых узко трактуют технологию как один из методов глубинного анализа данных для извлечения процесса, используемый исключительно для анализа в режиме офлайн. Это некорректно, и ниже подчеркнуты характерные особенности:
- Process mining не ограничивается извлечением моделей потока управления. Извлечение моделей процесса из журналов событий вызывает интерес как специалистов-практиков, так и представителей академического сообщества. Поэтому извлечение моделей потока управления зачастую рассматривается как наиболее примечательная составляющая process mining. Однако process mining не ограничен извлечением потока управления. С одной стороны, извлечение модели – это лишь одна из трех основных форм process mining (извлечение, подтверждение и усовершенствование). С другой стороны, область применения не сводится только к потоку управления: важную роль также играют организационный, временной ракурсы и ракурс кейсов.
- Процессная аналитика не является просто подвидом data mining. Process mining может рассматриваться как «недостающее звено» между data mining и традиционным управлением процессами (BPM). Большинство методов data mining вовсе не процессно-ориентированы. Модели процессов, потенциально показывающие параллелизм, не сравнимы с простыми структурами data mining, такими как дерево принятия решений и ассоциативные правила. Поэтому нужны абсолютно новые алгоритмы и формы представления данных.
- Process mining не ограничен офлайн-анализом. Методы process mining извлекают знания из накопленных данных о событиях. Несмотря на то, что используются данные постфактум, результаты применимы и к тем кейсам, которые еще находятся в обработке. Например, используя выявленную модель процесса, можно спрогнозировать время завершения обработки заказа клиента.
Руководящие принципы
Существуют очевидные ошибки, которые можно совершить, используя process mining на практике. Есть принципы, которые позволят пользователям и аналитикам их избежать:
- Данные о событиях должны считаться объектами первого класса
Стартовой точкой для process mining являются зарегистрированные события. Такие «сборники событий» обозначаются термином «журналы событий». Качество результатов напрямую зависит от данных на входе. Следовательно, к журналам событий следует относиться как к объектам первого класса ИС, в которых реализованы процессы, которые предполагается анализировать.
Чтобы получать выгоды от process mining, организациям следует стремиться к максимально высокому качеству журналов событий.
- Журналы должны извлекаться в соответствии с предметными вопросами
Действия process mining должны быть обусловлены вопросами. Крайне затруднительно извлечь осмысленные данные о событиях без предметных вопросов. Прежде чем применять какой-либо метод, необходимо определиться с типом кейсов для анализа. Этот выбор должен быть продиктован вопросами, на которые надо будет ответить, и это может оказаться нетривиальной задачей.
- Необходимость поддержки операторов параллелизма, выбора и других базовых элементов моделей потока управления
Существует множество нотаций описания процессов. Некоторые из них предоставляют большое количество элементов для моделирования, тогда как другие могут быть очень простыми. Описание потока управления – основа любой модели процесса. Базовые конструкции потока работ поддерживаются всеми наиболее популярными нотациями: это последовательное выполнение, параллельное выполнение и циклы. Эти паттерны должны поддерживаться методами process mining.
- События должны соотноситься с элементами модели
То, что process mining сводится к извлечению потока управления, является заблуждением, это мы уже выяснили. К тому же, извлечение – это лишь одна из трех форм process mining. Две другие формы process mining (подтверждение соответствия и усовершенствование) базируются на взаимосвязи между элементами модели и событиями в журнале. Это отношение может быть использовано для «воспроизведения» (replay) журнала событий в модели. Воспроизведение используется для того, чтобы выявить расхождения между журналом событий и моделью, например, если некоторые события в журнале невозможны согласно модели. Методы подтверждения соответствия количественно оценивают и диагностируют такие расхождения. Для различных типов анализа установление соотношения между событиями в журнале и элементами в модели является стартовой точкой.
- Модели следует рассматривать как целенаправленные абстракции реальности
Модель, созданная на данных о событиях, представляет собой точку зрения на реальность. Эта точка зрения должна представлять собой целенаправленную абстракцию поведения, выявленного в журнале событий. При заданном журнале полезными могут оказаться различные точки зрения. Кроме того, заинтересованным сторонам могут понадобиться «ракурсы» на ситуацию. На самом деле, модели, извлеченные из журналов событий, должны рассматриваться как «карты». Все эти карты показывают точку зрения на одну и ту же реальность, и нелепо предполагать, что существует «идеальная карта». То же самое относится и к моделям процессов: модель должна выделять то, что релевантно для конкретной категории пользователей.
- Process mining должен быть непрерывным процессом
Process mining позволяет строить содержательные «карты», напрямую связанные с данными о событиях. На такие модели можно проецировать как исторические данные о событиях, так и текущие данные. Вместе с тем процессы меняются во время их анализа. Учитывая динамическую природу процессов, нецелесообразно рассматривать process mining как однократное действие. Цель должна состоять не в том, чтобы создать стационарную модель, но в том, чтобы вдохнуть жизнь в модели процессов – сделать так, чтобы пользователи и аналитики стремились рассматривать их на ежедневной основе.
Вызовы
Для современных организаций, которые должны управлять нетривиальными операционными процессами, process mining – важный инструмент. С одной стороны, наблюдается невероятный рост объема данных о событиях. С другой стороны, информация должна быть идеально согласована с процессами, чтобы они удовлетворяли требованиям, связанным с комплаенсом, эффективностью и качеством обслуживания клиентов. Есть ряд важных вызовов, которые необходимо принимать во внимание. Их наличие показывает, что process mining является формирующейся дисциплиной. В следующей части рассмотрены некоторые из этих проблемных вопросов. Данный перечень не претендует на полноту: с течением времени могут возникнуть новые вызовы и задачи, решение которых потребует значительных усилий, а существующие могут исчезнуть по мере развития методов процессной аналитики.
- Поиск, сведение и очистка данных о событиях
По-прежнему требуются значительные усилия для извлечения данных о событиях, пригодных для process mining. Обычно необходимо преодолеть несколько препятствий:
- данные могут быть рассредоточены, и информацию требуется свести;
- данные о событиях часто являются «объектно-ориентированными», а не «процессно-ориентированными»;
- данные о событиях могут быть неполными;
- журнал событий может содержать «выбросы», т.е. аномальное поведение;
- журналы могут содержать события различной степени детализации;
- события происходят в определенном контексте.
Для решения вышеуказанных проблем необходимы более совершенные инструменты и методологии. К тому же, как указывалось ранее, организации должны воспринимать журналы событий как объекты первого класса, а не как побочный продукт.
- Работа со сложными журналами событий, имеющими различные характеристики
Журналы событий могут иметь очень разные характеристики. Некоторые журналы событий могут быть чрезвычайно большими, что затрудняет их обработку, в то время как другие журналы событий настолько малы, что данных недостаточно для того, чтобы сделать достоверные выводы. Помимо количества зарегистрированных событий, существуют и другие характеристики, такие как среднее число событий в кейсе, сходство кейсов, количество уникальных событий и количество уникальных путей процесса.
Поскольку журналы событий содержат лишь примеры поведения, их не следует считать полными. Методы process mining вынуждены иметь дело с неполнотой, используя «предположение об открытом мире»: тот факт, что что-то не произошло, не означает, что это не может произойти. Это затрудняет работу с небольшими журналами событий с большой вариативностью.
- Разработка показательных бенчмарков
Process mining является развивающейся технологией, и это объясняет, почему хорошие бенчмарки до сих пор отсутствуют. Например, на данный момент (2011 год – прим. ред.) доступны десятки методов process mining, различные вендоры предлагают различные продукты, но консенсуса насчет качества всех этих методов не наблюдается.
Создание показательных бенчмарков для process mining является важным, и некоторая предварительная работа уже проделана. Например, существуют различные метрики для измерения качества результатов process mining (подгонка, простота, точность и обобщенность).
С одной стороны, нужны бенчмарки, основанные на наборах данных из реальной жизни. С другой, есть необходимость создать синтетические наборы данных c определенными заданными характеристиками. Такие синтетические наборы данных будут способствовать разработке техник process mining, направленных на обработку неполных журналов событий, журналов событий с «шумами» или специфических категорий процессов.
- Работа с концептуальным дрифтом
Термин «концептуальный дрифт» описывает ситуацию, при которой процесс видоизменяется по ходу анализа. Он может быть обнаружен посредством разделения журнала событий на журналы меньшего размера и анализа «следов» в этих меньшего размера журналах. Такой анализ «второго порядка» требует существенно большего объема данных о событиях. Однако стабильных во времени процессов совсем немного, и понимание концептуального дрифта является важнейшей задачей в управлении процессами.
- Снижение предвзятости представления при извлечении процесса
Методы извлечения процесса создают модель в конкретной нотации. Однако важно разделять визуализацию результата и представление, получаемое во время извлечения самого процесса. Выбор целевой нотации зачастую включает в себя несколько неявных допущений, что ограничивает пространство исследований.
- Обеспечение баланса критериев качества: подгонки, простоты, точности и обобщенности
Достаточно частой является ситуация неполноты журналов событий, т. е. даны только некоторые примеры поведения. Модели процессов обычно допускают экспоненциальное или даже бесконечное количество различных «трасс» (traces) (при наличии «петель»). Кроме того, одни трассы встречаются с меньшей вероятностью, чем другие. Следовательно, нереалистичным будет предположить, что каждая возможная трасса представлена в журнале событий. Даже если там будут миллионы кейсов, крайне маловероятно, что представлены все возможные вариации. Дополнительная сложность состоит в том, что некоторые альтернативы встречаются реже, чем другие, и могут быть признаны «шумом». Невозможно построить разумную модель для слишком «шумного» поведения. Извлеченная модель должна абстрагироваться от этого, а низкочастотные варианты поведения предпочтительнее исследовать с использованием подтверждения соответствия.
Шум и неполнота делают извлечение процесса сложной задачей. По сути, есть четыре
конкурирующих измерения качества: (а) подгонка, (б) простота, (в) точность и (г) обобщенность.
- Кросс-организационный process mining
Традиционно process mining применяется в рамках одной организации. Однако по мере того, как сервисные технологии, интеграция цепей поставок и облачные вычисления распространяются все шире, возникают ситуации, когда журналы событий нескольких организаций становятся доступными для анализа. В принципе, возможны два режима кросс-организационного process mining: коллаборативный и выполнение различными организациями одного и того же процесса на основе обмена опытом либо же одной инфраструктуры.
Необходимо разрабатывать новые методы для обоих типов кросс-организационного process mining. Эти методы должны принимать во внимание вопросы конфиденциальности и безопасности. Организации могут не захотеть делиться информацией по причинам конкуренции или из-за отсутствия доверия. Поэтому важно разрабатывать методы process mining, обеспечивающие конфиденциальность.
- Сопровождение операционной деятельности
Изначально process mining был сфокусирован на анализе накопленных данных. Однако на сегодняшний день многие источники данных обновляются в режиме реального времени или близко к нему, а вычислительные мощности позволяют анализировать события в момент их возникновения. Соответственно, не стоит сводить process mining к офлайн-анализу, он может использоваться и для поддержки текущей операционной деятельности. Определены три задачи поддержки операционной деятельности: обнаружение, предсказание и рекомендации.
Применение методов process mining в режиме онлайн ставит дополнительные задачи, предъявляющие требования к вычислительным мощностям и качеству данных.
- Сочетание методов process mining с другими типами анализа
Операционный менеджмент, и в частности исследование операций, является разделом наук о менеджменте, в значительной степени опирающимся на моделирование. Глубинный анализ данных (data mining) может быть определен как «анализ наборов данных (часто больших) для обнаружения неожиданных взаимосвязей и обобщения данных нестандартными способами, которые понятны и полезны владельцу данных». Обе области знаний используют самодостаточные методы анализа. Задачей-вызовом является сочетание методов этих областей с process mining.
- Повышение удобства использования неспециалистами
Одной из целей process mining является создание «живых моделей процессов», т. е. таких моделей процессов, которые используются ежедневно, а не статичных моделей, которые в конечном итоге оказываются где-то в архиве. Новые данные о событиях могут использоваться для извлечения нового поведения. Связка между данными о событиях и моделями процессов дает возможность спроецировать текущее состояние и недавние действия на актуальные модели. Таким образом, конечные пользователи могут взаимодействовать с результатами process mining на ежедневной основе.
- Повышение понятности для неспециалистов
Даже если сгенерировать результаты process mining несложно, это на самом деле не означает, что эти результаты практичны. У пользователя могут возникнуть проблемы с пониманием выходных данных или появиться соблазн сделать неверные выводы. Чтобы избежать подобных проблем, результаты должны быть изложены с использованием подходящего представления.
В данном манифесте излагаются основные принципы и намерения рабочей группы. После введения в тематику process mining в данном манифесте перечисляются некоторые руководящие принципы и вызовы. Руководящими принципами следует пользоваться во избежание очевидных ошибок. Перечень вызовов определяет направления научных исследований и разработок. Оба раздела ставят целью повышение уровня зрелости process mining.
Прочитать Манифест в оригинале можно здесь.
Ознакомиться с российским переводом – здесь.