Библиотека ABSDATA

Все, что вы хотели знать о продажах по телефону.

Как анализировать историю обслуживания автомобиля? Научный подход

Автосервис 1735 0 +2

Как анализировать историю обслуживания автомобиля? Научный подход

мая
2016
23

В процессе обслуживания клиентов в учетной системе автосервиса накапливается большое количество данных о заявках, выполненых работах и результатах диагностики. Эти данные можно использовать, например, для повышения качества обслуживания или увеличения лояльности клиентов. Имея на руках точные расчеты, можно легко аргументировать клиенту необходимость проведения работ. В этой статье я поделюсь общими подходами к анализу данных. Мы будем применять современные методики анализа. Пусть вас не пугает научный текст данной статьи, на практике всё выглядит более чем просто. А если вас заинтересует решение вашей задачи, в завершении статьи я предложу вам принять участие в создании аналитической системы.

В данном конкретном случае нашей целью будет обеспечение безопасности автовладельцев (клиентов) и увеличение срока службы автомобилей.

12

Общее описание задачи

По каждому типу автомобиля (марка, год выпуска, тип двигателя, тип КПП и т. д.) в течение времени накапливается информация о ремонте и обслуживанию авто (дата, какие работы проводились), по регламентам ТО от производителя (период ТО, список работ), а также данные по ошибкам из диагностической системы автомобиля. В рамках проекта решаются следующие задачи:

  1. определить вероятность поломки определенного агрегата для каждого типа автомобиля;
  2. определить набор необходимых процедур входящих в ТО, выявить основные работы, необходимые для предотвращения отказов и увеличения срока жизни автомобиля.

Определение вероятности отказа

При определении вероятности отказа определенного агрегата наиболее важной переменной является продолжительность безотказной работы данного агрегата с момента его установления на автомобиль. Но эта величина существенно зависит от условий эксплуатации автомобиля, которые характеризуются различными факторами, например, насколько хорошо соотносится история обслуживания авто с регламентом ТО от производителя. Исходная выборка данных строится на основании таких интервалов безотказной работы, которые определяются в нашем случае из имеющихся данных по ремонту и обслуживанию авто. В анализируемых данных имеется существенная особенность, связанная с тем, как мы строим выборку. Может случиться так, что автомобиль в течение некоторого времени работал исправно, но при прохождении ТО были выявлены потенциальные поломки, которые могли бы возникнуть в автомобиле в ближайшем будущем. И после прохождения ТО соответствующие агрегаты были заменены. В этом случае, мы сталкиваемся с так называемыми неполными интервалами, или цензурированными данными, когда мы не знаем точного интервала безотказной работы агрегата. С этой же ситуацией мы сталкиваемся, когда все агрегаты в автомобиле исправны и работают в реальном времени. Несмотря на то, что в этом случае информация об отказах является неполной, она является полезной, и при решении данной задачи она также будет учитываться. Цензурированные данные типичны, когда исследуется время до наступления определённого события (поломки) и время исследований ограничено.

Общий подход, который мы решили применить к решению данной задачи, в литературе называется Теорией надежности (Reliability theory), или еще Анализом выживаемости (Survival analysis). В этом подходе используется так называемая функция надежности, представляющая собой вероятность того, что конкретный агрегат прослужит время большее заданной длины интервала, при заданном векторе параметров. С помощью этой кривой изучается долговечность агрегатов автомобиля. Помимо функции надежности, также рассматривается функция риска, равная вероятности отказать в момент определенный времени, при условии, что до этого момента отказов не было.

3

 

Итак, рассматриваем конкретный тип автомобиля и конкретный агрегат, а также множество пользователей, имеющих данный тип авто. На основании множества пользователей формируется выборка данных, состоящую из вектора параметров, длина промежутка времени и признака цензурированности. Если объект не цензурирован, то длина промежутка времени равна времени безотказной работы. Если объект не цензурирован, то длина промежутка времени меньше времени безотказной работы. Векторы признаков формируются на основе информации о ремонте и обслуживанию авто, а также регламенте ТО. По регламенту ТО можно сформировать эталонный вектор средних времен между выполнением определенных работ. Длина вектора равна числу работ, которые можно провести с авто при прохождении ТО. Далее по информации о ремонте и обслуживанию авто можно рассчитать отклонение реальных времен проведения работ с авто от эталонного признака. При формировании признаков можно также основываться на эталонной и реальной частотах проведения работ. Длина промежутка времени формируется на основании длины интервала безотказной работы данного агрегата с учетом цензурированности.

Принимается так называемая модель Кокса пропорционального риска (Cox proportional hazard model), которая представляется в виде произведения базовой функцией риска, зависящей только от времени, и относительной функцией риска, для которой предполагается регрессионная зависимость. Для решения исходной задачи необходимо определить функцию надежности, что позволит вычислять необходимые вероятности поломок.

4

Аналитически, задача решается с помощью максимизации общей функции правдоподобия. Но поскольку максимизация в явном виде является сложной аналитической задачей, то делаются некоторые допущения, которые позволяют определить регрессионные параметры с помощью задачи максимизации функции частного логарифма правдоподобия. Эта задача решается итеративным методом Ньютона-Рафсона. Откуда получается необходимая оценка регрессионных параметров.

Поиск базовой функции надежности можно осуществлять несколькими способами, из которых в процессе работы с реальными данными будет выбираться лучший.

a) Параметрический подход.

В этом подходе мы в явном виде задаем форму кривой базовой функции надежности (или точнее функцию распределения). Наиболее важны следующие семейства распределений, которые используются для описания продолжительности времени безотказной работы: экспоненциальное распределение, распределение Вейбулла и распределение Гомперца. Наиболее общим из этих распределений является распределение Вейбулла, которое вероятнее всего и будет использоваться на практике. Максимизация общей функции правдоподобия модели дает в явном виде оценки для риска в разные моменты времени. С помощью нелинейного метода наименьших квадратов мы можем получить оценку параметров функции риска для распределения Вейбулла. Зная параметры распределения, мы можем выписать общий вид распределения, который будет соответствовать оценке базовой функции надежности.

5

б) Непараметрический подход.

Этот подход основан на максимизации общего правдоподобия модели, что дает следующую в явном виде оценку для базовой функции надежности (Breslow’s estimator), благодаря чему мы можем выписать оценку общей функции надежности. Итак, полученная оценка функции надежности позволяет нам определять вероятность того, что агрегат будет безотказно работать в течение промежутка времени заданной длины, при заданных входных параметрах (несущих в себе всю доступную информацию об истории эксплуатации авто). А вероятность сломаться соответственно будет равна (1-функция надежности). Среднее время работы агрегата при заданных входных параметрах определяется численным значением площади под кривой функции надежности, которую можно эффективно вычислять различными методами. Таким образом можно определить дату поломки агрегата на основании среднего времени работы агрегата.

Определение набора необходимых процедур входящих в ТО

Если рассматривать работу каждого агрегата как независимый процесс, то вероятность того, что в автомобиле произойдет какая-нибудь поломка в течение заданного промежутка времени и при заданных условиях, определяется произведением вероятностей по каждому агрегату. Будем использовать жадный алгоритм для поиска набора процедур входящих в ТО. На каждой итерации выбирается такая процедура, которая дает наименьшее значение вероятности поломки. Таким образом, если добавить условие на ограничение бюджета, или на желаемое качество отказоустойчивости, мы за несколько итераций получим желаемый набор. Для упрощения вычислений можно рассматривать только небольшой набор агрегатов, которые имеют наибольшие вероятности поломок.

6

 

Также стоит отметить, что использование параметрического подхода к оценке функции надежности, позволит существенно сократить вычислительные затраты, поскольку в этом случае функции надежности, а соответственно и функция вероятности отказа, задается в явном виде в зависимости от входных параметров и времени. Также можно рассмотреть дополнительную задачу на минимизацию стоимости работ и максимизацию отказоустойчивости. Один из способов решения данной задачи: сделать перебор по подмножествам процедур, предварительно выбрав небольшое множество процедур, проведение которых имеет большие отклонения от регламента в истории расматриваемого автомобиля.

На начальном этапе, когда данных по каждому типу авто и агрегату мало, предлагается проводить агрегацию данных, например, делать выборки для всех авто, которые используют один и тот же агрегат (например, автомобили с одинаковым двигателем). Тем самым мы сможем оценивать отказоустойчивость отдельных агрегатов. В этом случае учет дополнительных факторов является нетривиальной задачей, поэтому будут применяться более простая модель функции надежности, не учитывающая векторы признаков.

С математической точки зрения решение в этом случае строится в два этапа:

1) Построение таблицы времен безотказной работы агрегата

Такую таблицу можно рассматривать как «расширенную» таблицу частот. Область возможных времен наступления критических событий (поломок, отказов и др.) разбивается на некоторое число интервалов. Для каждого интервала вычисляется число и доля объектов, которые в начале рассматриваемого интервала были «в рабочем состоянии», число и доля объектов, которые «отказали/произошла поломка» в данном интервале, а также число и доля объектов, которые оказались цензурированными в каждом интервале.

На основании этих величин вычисляются некоторые дополнительные статистики: число изучаемых объектов — это число объектов, которые были «в рабочем состоянии» в начале рассматриваемого временного интервала, минус половина числа цензурированных объектов; доля отказавших — это отношение числа объектов, отказавших в соответствующем интервале, к числу объектов, изучаемых на этом интервале; доля работающих — эта доля равна единице минус доля отказавших. А также суммарная доля работающих (функция надежности) — суммарная доля работающих к началу соответствующего временного интервала. Поскольку вероятности выживания считаются независимыми на разных интервалах, эта доля равна произведению долей работающих объектов по всем предыдущим интервалам. Полученная доля как функция от времени как раз и является функцией надежности.

7

 

2) Оценивание формы функции надежности

На втором этапе происходит оценивание формы функции надежности, для последующего прогнозирования вероятности работы конкретного агрегата во времени, а также определения средней продолжительности безотказной работы. Снова воспользуемся двумя подходами: а) параметрический, б) непараметрический:

а) Воспользуемся распределением Вейбулла, как было указано в основном алгоритме. Но только в этом случае параметры определяются не из риска, а из аппроксимации самой функции распределения. В качестве метода оценивания параметров можно воспользоваться алгоритмом метода наименьших квадратов (см. работу Gehan and Siddiqui, 1973). Для проведения оценивания применима модель линейной регрессии, поскольку все четыре перечисленных семейства распределений могут быть «сведены к линейным» (относительно параметров) с помощью подходящих преобразований.
б) Для цензурированных, но не группированных объектов времен безотказной работы, функцию надежности можно оценить непосредственно (без таблицы времен безотказной работы). Для каждого момента времени оценим вероятность не сломаться в этот момент. Такой оценкой будет отношение числа не отказавших в этот момент к числу наблюдавшихся к этому моменту объектов. Перемножая вероятности в каждом интервале, получим оценку для функции надежности, которая в литературе называется множительной оценкой Каплана-Мейера.

Далее, как и в основном алгоритме, можно определять зону риска для агрегатов, и на основе этого определять подходящий набор работ.

8

Зачем это нужно и что можно получить в результате?

На основании таких расчетов можно предоставлять клиентам следующую информацию:
— Текущее техническое состояние автомобиля и степень его надежности;
— Необходимые процедуры планово-предупредительно ремонта и сезонной подготовки автомобиля;
— Стоимость работ и запасных частей, необходимых для планово-предупредительного ремонта;
— Оптимальное время или пробег для проведения планово-предупредительного ремонта и сезонной подготовки автомобиля.
Всю эту информацию можно предоставлять клиентам через мобильное приложение, отправлять SMS-уведомления или сообщать по телефону.

Хотите применить методику в вашем бизнесе?

Я предлагаю вам принять участие в проекте по созданию аналитической системы. Мы уже создали упрощенный вариант системы, но еще многое предстоит сделать:

  1. Сделано: Создание математической модели, на основе которой будет строиться проект, включая определение зависимых и независимых переменных, входных данных, предполагаемых параметрических зависимостей, параметров, целевых функций;
  2. Сделано: Проектирование архитектуры системы;
  3. Сделано: Создание программы, моделирующей систему;
  4. Сделано: Построение системы тестов для модели и проведение «кабинетного» тестирования;
  5. Сделано: Запуск системы без оптимизаций, только для сбора информации;
  6. Построение гипотез о видах функций надежности;
  7. Проверка гипотез;
  8. Построение алгоритмов решения оптимизационных задач, как параметрических, так и непараметрических, а также сравнение их эффективностей и выбор наилучших алгоритмов;
  9. Имплементация полной функциональности системы;
  10. Отладка.

Проект включает создание мобильного приложения и системы SMS-уведомлений.

91011

 

Мы ищем единомышленников и обещаем, что реализуем систему, когда получим 100 писем поддержки от предприятий автобизнеса. Первыми интерес подтвердили «Арманд», «Вилгуд», «Автомобильная Сервисная Ассоциация», «Город Авто», «Автоспеццентр». Присоединяйтесь! Пожалуйста, позвоните нам по телефону +7 495 587-41-01 или отправьте письмо на info@absdata.ru с темой «Анализ истории обслуживания» . Мы не займем у вас более 5 минут. Спасибо за ваше время!

Получите доступ

к массе закрытых материалов сайта и черпайте полезную информацию круглосуточно и непрерывно.

поиск по сайту