Что происходит с каждым менеджером проектов: начинается планерка, и вдруг критический тикет блокируется, разработчик заболевает, зависимость срывается или задерживается ключевая функция. В одно мгновение ваш тщательно спланированный график начинает рушиться, и вы ищете решения.
В этой статье мы рассмотрим, как модель машинного обучения предсказала 41% задержек проектов до того, как они повлияли на график, сократив расходы и уменьшив количество экстренных ситуаций в последнюю минуту.
Проблема: 62% ИТ-проектов не укладываются в сроки в 2025 году
Работая с гибкими командами, я часто сталкивался с задержками и препятствиями, они быстро стали частью повседневной жизни. Но когда я наткнулся на исследование Wellington State of Project Management за 2025 год, в котором говорилось, что в 2025 году 62% ИТ-проектов не укладываются в сроки, это шокировало меня и побудило к действию. Это увеличение по сравнению с исследованием PMI Pulse of the Profession за 2017 год, где было 51% в 2017 году. Задержки проектов достигают критического уровня.
Я знаю, что задержки — обычное дело, но не представлял, что они будут настолько масштабными. Но сегодня у нас есть инструменты для прогнозирования и лучшего понимания этих рисков. Используя Python и Data Science, я создал модель для прогнозирования задержек проектов до их наступления.
Эта статистика подчёркивает два важных момента: задержки часто возникают из-за повторяющихся причин, и они имеют огромные последствия для бизнеса. В этой статье мы рассмотрим, как подходы, основанные на данных, могут выявить эти причины и помочь менеджерам проектов предвидеть их.
Пробел в данных в управлении проектами
В традиционном управлении проектами отчётность играет центральную роль, но лишь немногие отчёты предлагают всеобъемлющий, подробный ретроспективный анализ проекта в целом.
Например, в Scrum мы отслеживаем нашу скорость, следим за тенденциями на графике выгорания и измеряем количество выполненных стори поинтов. Традиционная отчётность всё ещё не даёт нам полной картины. Наука о данных может.
Как менеджеры проектов, мы можем знать из опыта, где лежат критические точки, но проверка этих предположений с помощью данных делает наши решения гораздо более надёжными.
Создание набора данных
Чтобы изучить эту идею, я проанализировал 5 000 билетов Jira — один из самых богатых источников доступных данных о проектах.
Поскольку реальные данные о проектах не всегда могут быть опубликованы, я сгенерировал синтетический набор данных в Python, который отражает реальность, включая такие ключевые переменные, как приоритет, стори поинты, размер команды, зависимости и задержка.
Анализ данных
Большинство билетов имеют низкий или средний приоритет, что соответствует тому, как обычно структурируются бэклоги проектов. Это начальное распределение уже намекает на то, где могут накапливаться риски, что мы рассмотрим подробнее в EDA.
Хотя билеты с высоким и критическим приоритетом составляют меньшую долю от общего числа, они непропорционально чаще задерживаются.
Эта гистограмма подтверждает явление: билеты с высоким приоритетом сильно связаны с задержками. Однако это может быть обусловлено двумя разными факторами:
- Билеты с высоким приоритетом по своей сути более сложны и поэтому подвержены большему риску задержек.
- Некоторые билеты становятся приоритетными только потому, что они были задержаны в первую очередь, создавая порочный круг эскалации.
С помощью этого смоделированного набора данных у нас теперь есть реалистичный снимок того, что происходит в реальных проектах: билеты различаются по размеру, зависимостям и сложности, и некоторые из них неизбежно задерживаются. Это отражает повседневные проблемы, с которыми сталкиваются менеджеры проектов.
Технический глубокий анализ: прогнозная модель
Чтобы лучше понять динамику реальных проектов, мы разработали новые функции, отражающие реалии управления проектами:
- Сложность на человека = стори поинты / размер команды.
- Есть зависимость = зависит ли билет от других (зависимости > 0).
- Взаимодействие приоритета и стори поинтов = уровень приоритета, умноженный на стори поинты.
Мы выбрали модель Random Forest, потому что она может обрабатывать нелинейные отношения и даёт представление о важности функций.
Модель достигла воспоминания 0,41, что означает, что она успешно выявила 41% задержанных билетов.
Интерпретируемость модели, подсчёт очков, бизнес-воздействие, дашборд и валидация модели
Чтобы по-настоящему понять, почему модель делает эти прогнозы, нам нужно заглянуть внутрь. Какие функции больше всего влияют на риск задержки? Здесь вступает в игру интерпретируемость модели.
Мы можем наблюдать, что сложность и взаимодействие приоритета и стори поинтов являются наиболее сильными драйверами точности прогнозирования.
Анализ бизнес-воздействия
Билеты с наивысшими баллами риска подтверждают тенденцию: только задачи с высоким и критическим приоритетом несут наибольший риск.
Этот инсайт важен не только для управления графиком проекта, но и для его финансового воздействия на бизнес. Задержки не только замедляют доставку, они увеличивают расходы, снижают удовлетворённость клиентов и потребляют ценные ресурсы команды.
Заключение
В заключение, эта статья показала, как наука о данных может помочь сделать проекты более плавными, предоставляя более чёткое понимание причин задержек.
Данные не заменяют интуицию менеджера проектов, но усиливают её, подобно тому как пилоту дают более точные приборы для навигации.
Прогнозируя риски и выявляя билеты с повышенным риском, мы можем сократить задержки, предотвратить конфликты и в конечном итоге обеспечить более высокую отдачу.
Менеджеры проектов должны осваивать науку о данных. Сегодня есть два типа PM: традиционные и ориентированные на данные. Они не конкурируют в одной лиге.
Наконец, эти навыки не ограничиваются управлением проектами. Они распространяются на управление продуктами и бизнес-анализ. Изучение SQL или Python расширяет ваши возможности для совместной работы с разработчиками, понимания производительности продукта и эффективного общения на всех уровнях бизнеса.
