Анализ редких событий с помощью контрольных карт Шухарта

Статья: [39] DONALD J. WHEELER: "Working with Rare Events". Источник: www.qualitydigest.com
Перевод, примечания и дополнительные графические материалы с пояснениями: научный директор Центра AQT Григорьев С. П. , с использованием материалов статьи и разрешения, любезно предоставленных ему Дональдом Уилером.

Бесплатный доступ к статьям нисколько не уменьшает ценности изложенных в них материалов.

Что происходит, когда среднее количество становится очень маленьким?

С точки зрения анализа данных редкие события являются проблематичными. Пока у нас не будет события, подсчитывать нечего, и в результате многие из наших временных периодов закончатся нулевыми значениями. Поскольку нулевые значения не содержат реальной информации, нам необходимо рассмотреть альтернативы подсчету редких событий. В этой статье будут рассмотрены простые и сложные способы работы с редкими событиями.

Наш первый пример будет связан с разливами на химическом заводе. Хотя разливы нежелательны, и хотя делается все возможное для их предотвращения, иногда они случаются. За последние несколько лет на одном заводе в среднем происходил один разлив каждые восемь месяцев. Конечно, если на заводе происходит разлив в среднем один раз в восемь месяцев, то 1 разлив в месяц будет иметь значение на 700% выше среднего! (При работе с редкими событиями изменение на одну единицу может привести к огромной разнице в процентах.) Всего за первые четыре года произошло шесть разливов. Шесть разливов за 48 месяцев дают в среднем 0,125 разливов в месяц.

Как насчет использования XmR-карты для индивидуальных значений и скользящих размахов с этими подсчётами, как я предлагал ранее, в статье: Контрольные карты для альтернативных данных (атрибутов, подсчётов) p-карта, np-карта, C-карта и u-карта или одна XmR-карта индивидуальных значений ? Используя первые четыре года в качестве базовой линии, мы получим верхний контрольный предел карты скользящих размахов равный: 0,83, а для X-карты индивидуальных значений: 0,80. Это превращает каждый месяц с разливом в сигнал об изменении в системе! Ясно, что это неправильная интерпретация этих данных. Проблема в том, что эта XmR-карта в этом случае страдает от нехватки данных. (Редкие данные могут иметь место с любым типом данных. Данные подсчётов обычно бывают фрагментарными, если среднее количество подсчётов опускается ниже 1,00. Редкие данные искусственно сужают пределы диаграммы поведения процесса и приводят к избыточному количеству ложных тревог).

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 1. Количество разливов в месяц на XmR-картеы

С подсчётом редких событий специальные карты становятся нечувствительными, а XmR-карта выходит из строя. Это проблема не контрольных карт, а самих данных. Подсчёт редких событий по своей природе нечувствителен и слаб. Независимо от того , как эти подсчёты анализируются, помещая эти данные на контрольную карту любого типа мы ничего не обнаружим. Но есть и другие способы охарактеризовать редкие события. Вместо того, чтобы подсчитывать количество разливов каждый месяц (подсчет событий), вы могли бы вместо этого измерять количество дней между разливами (измерять область определения между редкими событиями). Для этих данных интервалы времени между разливами рассчитываются следующим образом.

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 2. Определение времени между разливами.

Один разлив за 322 дня превращается в скорость разлива 0,0031 разлива в день: 1⁄322=0,0031

Если умножить суточную норму разлива на 365, получим 1,13 разливов в год: 0,0031×365=1,1315

Таким образом, интервал между первым и вторым разливами эквивалентен разливу со скоростью 1,13 разлива в год. Таким же образом интервал в 247 дней между вторым и третьим разливами преобразуется в коэффициент разлива 1,48 разливов в год. Продолжая таким образом, каждый раз, когда у нас происходит событие, мы получаем мгновенную скорость разлива.

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 3. Мгновенные скорости разливов

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 4. XmR-карта для скорости разливов

Средняя скорость разливов в течение первых четырех лет составляет 1,418 разлива в год. Средний скользящий размах составляет 0,244. Хотя использование пяти значений для создания диаграммы XmR минимально, на получение этих пяти значений ушло четыре года!

Если будущая точка окажется выше верхней контрольной границы, это будет означать, что скорость разлива увеличивается. В будущем точка ниже нижней контрольной границы будет означать, что скорость разлива снижается. Точки в зоне между контрольными границами будут интерпретироваться как означающие, что скорость разлива не изменилась. Два разлива в 2005 году имели интервалы 172 и 115 дней соответственно. Эти интервалы преобразуются в интенсивность (скорость) разливов 2,12 разливов в год и 3,17 разливов в год. Когда эти значения добавляются к XmR-карте, мы получаем результат, представленный на рисунке 5.

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 5. Полная XmR-карта для скорости разливов

Хотя первый разлив в 2005 году находится за пределами лимита, он едва превышает его. Учитывая мягкость лимитов, основанных на пяти значениях, мы можем не спешить интерпретировать шестую точку как явный сигнал об изменениях. Однако седьмая точка находится достаточно далеко за пределами пределов, чтобы ее можно было смело интерпретировать как однозначный сигнал - в текущем году произошло увеличение уровня разлива. Если мы вернемся к рисунку 1, то увидим, что разливы становятся все ближе друг к другу, но мы не сможем обнаружить это изменение, пока не перейдем от подсчета редких событий к измерению области возможностей между событиями.

Обратите внимание, что, хотя на рисунках 1 и 5 рассматриваются скорости разливов, произошло изменение переменной между рисунками 1 и 5. На рисунке 1 переменной было количество разливов в месяц. Здесь числитель мог изменяться (количество разливов), в то время как знаменатель оставался постоянным (один месяц). На рисунке 5 представлены мгновенные скорости разлива, где числитель остается постоянным (один разлив), а знаменатель может изменяться (дни между разливами).

Вместо использования мгновенных значений скорости разлива на рисунке 6 для построения диаграммы XmR используется количество дней между разливами. Эта контрольная карта является диаграммой обратной меры. По мере того, как разливы становятся более частыми, точки на рисунке 6 перемещаются вниз. Эта простая инверсия создает когнитивный диссонанс для тех, кто должен интерпретировать эту контрольную карту. Хотя это не является непреодолимым препятствием, это все же препятствие, в котором нет необходимости. Мгновенные скорости разлива, показанные на рисунке 5, легче использовать и легче интерпретировать, чем количество дней между разливами на рисунке 6.

Вероятная ошибка (probable error) стабильной системы измерений

Рисунок 6. XmR-карт для дней между разливами

В дополнение к тому, что время между событиями является обратной мерой, диаграмма менее чувствительна, чем диаграмма для мгновенных значений скорости разлива. На Рисунке 5 будет обнаружена повышенная скорость разливов всякий раз, когда эта скорость превышает 2,066 разливов в год. Нижний предел на рисунке 6 соответствует скорости разлива 2,714 (365×1/134,475) разливов в год. Учитывая, что это методы для редких событий и что мы хотим обнаруживать любое увеличение скорости разлива как можно быстрее, такая низкая чувствительность, показанная на рисунке 6, нежелательна.

Хотя контрольная карта мгновенных скоростей обычно является предпочтительной контрольной картой, есть одна ситуация, когда диаграмма времени между событиями полезна. Это когда нижний предел рисунка 5 опускается ниже нуля. Когда это произойдет, на контрольной карте мгновенной скорости больше не будет отображаться улучшений. Если вы участвуете в принятии мер по снижению частоты редких событий, так что обнаружение улучшений важно, тогда вам, возможно, придется прибегнуть к построению контрольных карт как мгновенных скоростей, так и времени между событиями. Контрольная карта мгновенных скоростей позволит вам обнаруживать увеличение частоты редких событий, а контрольная карта времени между событиями, в этом случае, позволит вам обнаруживать снижение скорости в виде точек выше верхней контрольной границы. Это будет проиллюстрировано следующим примером.

Резюме

Когда среднее количество за период времени падает ниже 1,0 (единицы), вы работаете с редкими событиями. Когда это произойдет, p -chart, np -chart, c -chart и u -chart станут очень нечувствительными. В то же время проблема редких данных не позволит вам использовать диаграмму XmR с подсчетом элементов или количеством событий. Когда это происходит, вам следует отказаться от подсчета событий за период времени и вместо этого измерить область определения между редкими событиями. Здесь вы перестаете получать значение каждый раз, а вместо этого получаете значение каждый раз, когда у вас есть событие. (Этот сдвиг в том, как вы собираете данные, свидетельствует против использования этого подхода, за исключением редких случаев.)

При работе с временем между событиями вы можете вычислить мгновенные скорости для каждого события и поместить их на диаграмму XmR, как показано на рисунках 4 и 5, или вы можете работать напрямую со временем между событиями, как показано на рисунке 6. Когда эти контрольные карты становятся односторонними, вам может потребоваться работать с обеими видами контрольных карт, чтобы выявить как улучшения, так и ухудшение.

Григорьев С. П.: Например, для анализа данных аварийных космических пусков может быть использована область определения — число успешных пусков между аварийными, где аварийные пуски используются в качестве редких событий. В качестве скорости аварийных пусков может быть использовано значение, полученное делением 1 аварийного пуска на число успешных пусков от предыдущего аварийного. Или вы можете работать напрямую с числом успешных пусков между аварийными.