Flagman
Со всем уважением, должен сказать, что приведенная Вами картинка не имеет ничего общего с оценкой надежности модели.
Свойства нормального распределения – это только его свойства и никак не более.
Прошу прощения за детский подход, но мне хочется напомнить, откуда берется этот самый гаусс. А происходит он из переопределения равновероятных событий. Имеет только два существенных параметра – мат. ожидание и дисперсию, первый из которых имеет «внутри» постоянную ошибку, в том числе инструментальную, последний – отражает уровень неопределенности результата из-за неопределенности переменных.
Дисперсия – очень лукавая вещь, так как всякая определенность ее вроде бы уменьшает. Причем те, кто играл с гауссом, знает, что в качестве «определенностей» легко выступают различные допущения и ограничения, которые по определению «загрубляют» процедуру и в результате снижают достоверность моделирования.
По поводу картинки прогноза продаж хочу опять поиграть с цифрами.
Вот как раз детская задачка на тему «откуда берется гаусс».
Например, мы продаем лопаты в некоем магазине, в котором кроме наших, выставлены еще 4 вида лопат. Итого 5 видов. Каждый день, в среднем, магазин продает 5 лопат. Допустим, что все лопаты практически одинаковы по потребительским характеристикам и продаются с одинаковым успехом. Таким образом, вероятность, что сегодня продадут и нашу лопату весьма высока. Посчитаем.
Покупатель делает выбор в пользу нашей лопаты с вероятностью 0,2.
Вероятность, что два покупателя сегодня сделают этот выбор 0,2*0,2=0,04
Что три из пяти будут наши – 0,2*0,2*0,2=0,008
То же и в обратную сторону.
Риск того, что не будет продана ни одна сегодня или того, что одна продастся за два дня 0,2*0,2=0,04. То, что одна уйдет за три дня - 0,2*0,2*0,2=0,008.
Получим уже хорошее распределение, а если учтем, что другие лопаты нас не интересуют, то откинем их, а также непросчитанные нами, но очевидно микровероятные события, а принятые нами вероятности посчитав за полный круг событий (сумма=1, т.е. интеграл под гауссом (площадь) =1), нормируем функцию и имеем вероятность выполнения плана продаж в одну лопату в день (см. Р1 на рис.).
Эта вероятность = 0,67. Но…
Закон больших чисел – самый большой друг маркетолога.
Мы уверенно говорим, что торгуем не день и не два.
Тогда вероятность выполнения плана по выборке из двух дней получим перемножением соответствующих вероятностей, а поскольку мы не выходим из полного круга событий, результат также нормируем (см. Р2). Вероятность выполнения плана продаж уже 0,92.
За 4 дня (см. Р3) – аж 99,7%. То есть, я абсолютно точно продам 4 лопаты за 4 дня.
Так?
Дальше мои уже совершенно спекулятивные рассуждения о новом товаре могут выглядеть в таком же ключе. То есть вместо лопаты – грабли. Я не знаю, купит ли их один из пяти человек, пришедших за лопатой. Оцениваю эту вероятность 50/50. То есть мои шансы вдвое хуже, чем у конкурентов – лопат. Из этого логично предположить, что я буду продавать по 1 предмету в два дня. Но какой я тогда маркетолог? Забудем про лопаты! Нас ведь интересует полный круг событий по граблям. Итак:
купит 1 грабли – 0,5,
купит 2 штуки – 0,25,
купит 3 штуки – 0,125, и обратно то же.
Не буду повторять всю дальнейшую чушь, но вероятность выполнения плана по граблям в день за 4 дня составит 88,3%. Ок?
Не ловите меня за руку, я хочу показать, что вопрос лишь в способе рассуждений.
Дело в том, что здесь присутствует 4 шага, «затачивающих» гаусса под наши нужды.
Более верный способ в этом простом примере на больших числах заключается в обобщении в один прием. Соотнесу его с картинкой Флагмана.
За сезон в сети магазинов продается 5 тыс. лопат. Наша в ассортименте каждая пятая. Надежность выполнения плана (1000 шт.) в диапазоне от 750 до 1250 шт. НЕ БОЛЕЕ 67%.
Причем это в настолько простом примере, что моделирование и не требуется.
Где же Вы тогда предполагаете получить 95%?