Профессиональный анализ данных

Пример составления прогноза продаж

 Изначально статья затевалась как наглядный пример практики научного подхода к прогнозированию продаж на предприятии. Но сейчас это уже не актуально – уже на большинстве предприятий наряду с экспертным активно используют научный подход к прогнозированию, и главное формируется пакет аргументированных претензий со стороны заказчиков относительно подходов и базовых принципов прогнозирования. Такое взаимодействие позволяет развиваться моделям прогнозирования в соответствии с требованиями практического применения в экономике.

 Основная цель статьи на сегодняшний день – простое изложение общих принципов и подходов прогнозирования. Отдельным бонусом является освещение наиболее часто встречающейся терминологии, которая безусловно послужит отправной точкой для всех начинающих и желающих познавать искусство прогнозирования.

 В качестве примера привожу практику годового прогнозирования продаж розничной сети ресторанов быстрого питания. Следуя политике конфиденциальности, сохраняю данные заказчика в тайне. Алгоритм прогнозирования осуществляется  пошагово. На первом шаге проводится подготовка данных. На втором и третьем шаге идентифицируются факторы, влияющие на продажи. Далее на четвертом шаге анализируются большие отклонения смоделированных продаж от фактических. И наконец, на пятом шаге происходит непосредственно процесс прогнозирования и планирования продаж.

 Шаг 1. Подготовка данных. Чтобы понять, как процесс будет развиваться в будущем, необходимо изучить зависимости, наблюдавшиеся в уже осуществившиеся исторические периоды. Определение исторического горизонта для изучения вопрос экспертный: нужно понимать, что чем глубже мы уходим в историю, тем больше мы используем данные тенденций более поздних периодов и как следствие, результаты прогноза могут быть менее актуальными. С точки зрения статистики исторический период должен быть как минимум в три раза больше периода прогноза. Так  мы будем иметь достаточно информации не только для качественного прогноза, но и для последующего планирования. Итак, возьмём историю продаж за три года (см. рис 1)

grafik_1

Поскольку разные месяцы имеют разное кол-во дней продаж, а в данном случае в силу обстоятельств были случаи, когда торговая точка работала не полный месяц, была проведена работа по приведению суммарных месячных продаж к одному кол-ву дней (см. рис. 2).

Приведенная продажа за месяц = (Фактическая продажа за месяц)/(Кол-во отработанных дней)×30,5

grafik_2

Как видно из графика данные о ежемесячных продажах за три года имеют растущую динамику, содержат 3 цикла (1 цикл= 1 году). Циклы обладают ярко выраженной сезонностью. Теперь можно переходить к следующему шагу.

 Шаг 2. Определение динамики в продажах за три года. Динамику процесса характеризует линия тренда. Процесс выражения имеющихся данных наблюдений простой аналитической функцией, когда фактическая зависимость более сложная для аналитического представления называется аппроксимацией. На рис. 3 приведен пример аппроксимации данных продаж простой линейной функцией y = 659x + 69477 – линией тренда. Аппроксимация поможет нам идентифицировать факторы, влияющие по нашему мнению на продажи. Фактор считается идентифицированным, если получен алгоритм, согласно которому для каждого периода наблюдения (в данном случае это месяц года) можно получить аппроксимированное значение прогнозируемой величины (в данном случае продажи за месяц).

grafik_3

После того как динамика за три года идентифицирована, она, как фактор влияющий на вариативность данных исключается. Такая операция называется детрендализацией (см. рис. 4).

grafik_4

Следует заметить, что перед идентификацией динамики процесса с ярко выраженной сезонностью рекомендуется провести процедуру сглаживания временного ряда. Это позволит лучше понять динамику процесса и соответственно определить наиболее оптимальную линию тренда.

 Шаг 3. Определение сезонной составляющей. Два проделанных выше шага позволяют нам идентифицировать третий  фактор, влияющий на вариативность данных – сезонность. В силу специфики потребления продукции предоставляемой сетью к летнему периоду наблюдается спад в продажах, тогда как к зимнему – рост. Для идентификации сезонности данные после детрендализации (см. рис. 4) группируем в зависимости от месяца продаж, и независимо от года.

grafik_5

К полученным данным (см. рис. 5) можно применять различные модели аппроксимации для идентификации фактора. Например, аппроксимировать дискретно каждый месяц с помощью среднего значения. Однако в этом случае уже осуществившиеся продажи прошлого месяца, например не будут корректировать прогноз продаж на будущий месяц. Есть мнение, что это не совсем правильно. Поэтому для  аппроксимации пробуем использовать функцию — полином 5-ой степени (см. рис. 6).

grafik_6

Сразу необходимо успокоить читателей – задача подбора оптимальной линии аппроксимации автоматизирована благодаря существующим статистическим продуктам, например электронным таблицам Excel, и носит название подгонки кривых. Оптимальной считается линия, для которой среднее абсолютное отклонение от фактических данных минимальное. Показатель R2 указывает на степень соответствия выбранной модели имеющимся данным. Чем ближе этот показатель к единице, тем лучше соответствие выбранной модели имеющимся данным. В нашем примере показатель R2 равен 0,67. Показатель R2 можно увеличить, если проанализировать отклонения отдельных наблюдений от аппроксимирующей линии и по возможности их устранить.

grafik_7

 Шаг 4. Анализ больших отклонений. Как правило после идентификации трендовой и сезонной составляющей остаются несистемные отклонения, некоторые из которых можно идентифицировать. Так выделенная точка на рис. 7 есть данные о продажах за ноябрь 2009 г. В этот период был карантин по гриппу – сезонное непериодическое мероприятие. А поскольку сеть ориентирована на студентов, то очевидно, что именно карантин повлиял на падение продаж в этот период. Такой уникальный опыт можно добавить в календарь событий (теперь мы понимаем, на сколько могут упасть продажи, в таком случае), а точку можно удалить из анализа, что повысит качество модели. Очевиден резкий скачек в продажах при переходе от августа к сентябрю (на этот факт указывает красная стрелка). Это период выхода студентов с летних каникул на занятия. Чтобы учесть такие эффекты используют сплайн-аппроксимацию (не рассматривается в данной статье)

 Заказчикам всегда интересно как будут выглядеть прогнозы в сравнении с фактическими данными, вместо сложных и непонятных показателей ошибок прогноза (MAD, MAPE, …). Приведем такое сравнение на графике для уже осуществившихся данных. Для этого копируем линию аппроксимации сезонной составляющей на три года, накладываем удаленную ранее динамику за три года, и возвращаем каждому месяцу кол-во отработанных дней.

grafik_9_2

Из графика видно как фактические продажи от месяца к месяцу отличаются от ex post прогнозов то в меньшую, то в большую сторону и этот факт достаточно случаен. Отсутствие систематических отклонений в меньшую или в большую сторону говорит о том, что системных изменений в факторах, оказывающих влияние на продажи, не наблюдается, а значит, нет и системных ошибок в модели прогнозирования.

 Шаг 5. Прогнозирование и планирование продаж. Теперь мы готовы перейти непосредственно к прогнозу на 2012 год. В основе прогнозирования будущих периодов лежит метод экстраполяции. Метод экстраполяции подразумевает использование зависимостей полученных на основании исторических данных для будущих периодов. На рис. 9 видно как сезонная аппроксимация с учетом сложившейся за три года динамики в продажах экстраполируется на 2012 год.

grafik_10

Любой прогноз — это не просто число, или как говорят в статистике точечная оценка. Так по данным на рис. 5 мы можем определить не только средние продажи за месяц, но и сформировать виденье о наилучших и наихудших продажах в месяц. Формализовать такое виденье помогают доверительные интервалы.

grafik_11

Ширина интервала зависит от выбранного уровня риска. Так 5% уровень риска означает, что лишь в 5% всех возможных исходов доверительный интервал не покрывает фактического значения.

Определив для себя допустимый уровень, риска, компания, благодаря интервальной оценке, формирует в частности понимание о наихудшем и наилучшем ожидаемом исходе. Соответственно закладывать итоговую сумму бюджета компании, подразделения на будущий период целесообразней исходя из наихудших ожидаемых продаж в прогнозируемом периоде на принятом уровне риска. Мотивировать сотрудников целесообразней в интервале от наиболее ожидаемых до наилучших ожидаемых значений прогнозируемого параметра. В самом деле, если ранее продажи достигали уровня выше среднего, и эти факты модель прогнозирования оценила, как весьма вероятные, то логично ожидать от персонала повторения подобных подвигов, и остается только правильно их замотивировать.

grafik_12

 В заключение следует отметить, что прогноз продаж является отправной точкой, в частности для планируемых показателей деятельности предприятия. Дело в том, что модель прогноза учитывает только закономерные, постоянно действующие тенденции. Соответственно при отсутствии ожиданий серьезных изменений на рынке или внутри компании вряд ли стоит значительно отклоняться от прогноза при расчете плановых показателей.

Об особенностях использования прогнозов читайте статью:

Прогноз или предсказание — возможности выбора Необходимо понимать, что модель или алгоритм прогнозирования – это не Нострадамус, способный предвидеть будущее. Представим, что Вы купили магический шар. Прогноз, сделанный этим устройством, оправдался. Значит, Вы вывели нужное кол-во людей, закупили столько сырья сколько необходимо и т. д  … читать далее

Пока нет комментариев

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Для получения консультации по данной теме заполните форму обратной связи с указанием темы и описанием проблемы:





Ваше имя (обязательно)

Ваш e-mail (обязательно)

Тема

Сообщение