Нормальный закон распределения его параметры. Нормальное распределение (Гаусса) в Excel

Нормальный закон распределения его параметры. Нормальное распределение (Гаусса) в Excel

Случайная величина называется распределенной по нормальному (Гауссовскому) закону с параметрами аи () , если плотность распределения вероятностей имеет вид

Величина, распределенная по нормальному закону, всегда имеет бесчисленное множество возможных значений, поэтому ее удобно изображать графически, с помощью графика плотности распределения. Согласно формуле

вероятность того, что случайная величина примет значение из интервала равна площади под графиком функции на этом интервале (геометрический смысл определенного интеграла). Рассматриваемая функция неотрицательна и непрерывна. График функ­ции имеет вид колокола и называется кривой Гаусса или нормальной кривой.

На рисунке изображено несколько кривых плотности распределения случайной величины, заданной по нормальному закону.

Все кривые имеют одну точку максимума, при удалении от которой вправо и влево кривые убывают. Максимум достигается при и равен .

Кривые симметричны относительно вертикальной прямой, проведенной через наивысшую точку. Площадь подграфика каждой кривой равна 1.

Различие отдельных кривых распределения состоит лишь в том, что суммарная площадь подграфика, одна и та же для всех кривых, различным образом распределена между различными участками. Основная часть площади подграфика любой кривой сосредоточена в непосредственной близости наивероятнейшего значения , а это значение у всех трех кривых разное. При различных значениях и а получаются различные нормальные законы и различные графики плотности функции распределения.

Теоретические исследования показали, что большинство встречающихся на практике случайных величин имеет нормальный закон распределения. По этому закону распределяется скорость газовых молекул, вес новорожденных, размер одежды и обуви населения страны и много других случайных событий физической и биологической природы. Впервые эту закономерность заметил и теоретически обосновал А. Муавр.

При , функция совпадает с функцией , о которой уже шла речь в локальной предельной теореме Муавра–Лапласа. Плотность вероятности нормального распределения легко выражаетсячерез :

При таких значениях параметров нормальный закон называется основным .

Функция распределения для нормированной плотности называется функцией Лапласа и обозначается Φ(х) . Мы также уже встречались с этой функцией.

Функция Лапласа не зависит от конкретных параметров а и σ. Для функции Лапласа, с помощью методов приближенного интегрирования составлены таблицы значений на проме­жутке с разной степенью точности. Очевидно, что функция Лапласа является нечетной, следовательно, нет необходимости помещать в таблицу ее значения при отрицательных .



Для случайной величины, распределенной по нормальному закону с параметрами а и , математическое ожидание и дисперсия вычисляются по формулам: , .Среднее квадратическое отклонение равно .

Вероятность того, что нормально распределенная величина примет значение из интервала , равна

где есть функция Лапласа, введенная в интегральной предельной теореме.

Часто в задачах требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины X от своего математического ожидания по абсолютной величине не превосходит некоторого значения , т.е. вычислить вероятность . Применяя формулу (19.2), имеем:

В заключение приведем одно важное следствие из формулы (19.3). Положим в этой формуле . Тогда , т.е. вероятность того, что абсолютная величина отклонения X от своего математического ожидания не превысит , равна 99,73%. Практически такое событие можно считать достоверным. В этом и состоит сущность правила трех сигм.

Правило трех сигм. Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания практически не превосходит утроенного среднего квадратического отклонения.

Рассмотрим Нормальное распределение. С помощью функции MS EXCEL НОРМ.РАСП() построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел, распределенных по нормальному закону, произведем оценку параметров распределения, среднего значения и стандартного отклонения .

Нормальное распределение (также называется распределением Гаусса) является самым важным как в теории, так в приложениях системы контроля качества. Важность значения Нормального распределения (англ. Normal distribution ) во многих областях науки вытекает из теории вероятностей.

Определение : Случайная величина x распределена по нормальному закону , если она имеет :

Нормальное распределение зависит от двух параметров: μ (мю) - является , и σ (сигма) - является (среднеквадратичным отклонением). Параметр μ определяет положение центра плотности вероятности нормального распределения , а σ - разброс относительно центра (среднего).

Примечание : О влиянии параметров μ и σ на форму распределения изложено в статье про , а в файле примера на листе Влияние параметров можно с помощью понаблюдать за изменением формы кривой.

Нормальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Нормального распределения имеется функция НОРМ.РАСП() , английское название - NORM.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина X, распределенная по нормальному закону , примет значение меньше или равное x). Вычисления в последнем случае производятся по следующей формуле:

Вышеуказанное распределение имеет обозначение N (μ; σ). Так же часто используют обозначение через N (μ; σ 2).

Примечание : До MS EXCEL 2010 в EXCEL была только функция НОРМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности. НОРМРАСП() оставлена в MS EXCEL 2010 для совместимости.

Стандартное нормальное распределение

Стандартным нормальным распределением называется нормальное распределение с μ=0 и σ=1. Вышеуказанное распределение имеет обозначение N (0;1).

Примечание : В литературе для случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение z.

Любое нормальное распределение можно преобразовать в стандартное через замену переменной z =(x -μ)/σ . Этот процесс преобразования называется стандартизацией .

Примечание : В MS EXCEL имеется функция НОРМАЛИЗАЦИЯ() , которая выполняет вышеуказанное преобразование. Хотя в MS EXCEL это преобразование называется почему-то нормализацией . Формулы =(x-μ)/σ и =НОРМАЛИЗАЦИЯ(х;μ;σ) вернут одинаковый результат.

В MS EXCEL 2010 для имеется специальная функция НОРМ.СТ.РАСП() и ее устаревший вариант НОРМСТРАСП() , выполняющий аналогичные вычисления.

Продемонстрируем, как в MS EXCEL осуществляется процесс стандартизации нормального распределения N (1,5; 2).

Для этого вычислим вероятность, что случайная величина, распределенная по нормальному закону N(1,5; 2) , меньше или равна 2,5. Формула выглядит так: =НОРМ.РАСП(2,5; 1,5; 2; ИСТИНА) =0,691462. Сделав замену переменной z =(2,5-1,5)/2=0,5 , запишем формулу для вычисления Стандартного нормального распределения: =НОРМ.СТ.РАСП(0,5; ИСТИНА) =0,691462.

Естественно, обе формулы дают одинаковые результаты (см. файл примера лист Пример ).

Обратите внимание, что стандартизация относится только к (аргумент интегральная равен ИСТИНА), а не к плотности вероятности .

Примечание : В литературе для функции, вычисляющей вероятности случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение Ф(z). В MS EXCEL эта функция вычисляется по формуле
=НОРМ.СТ.РАСП(z;ИСТИНА) . Вычисления производятся по формуле

В силу четности функции распределения f(x), а именно f(x)=f(-х), функция стандартного нормального распределения обладает свойством Ф(-x)=1-Ф(x).

Обратные функции

Функция НОРМ.СТ.РАСП(x;ИСТИНА) вычисляет вероятность P, что случайная величина Х примет значение меньше или равное х. Но часто требуется провести обратное вычисление: зная вероятность P, требуется вычислить значение х. Вычисленное значение х называется стандартного нормального распределения .

В MS EXCEL для вычисления квантилей используют функцию НОРМ.СТ.ОБР() и НОРМ.ОБР() .

Графики функций

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Как известно, около 68% значений, выбранных из совокупности, имеющей нормальное распределение , находятся в пределах 1 стандартного отклонения (σ) от μ(среднего или математического ожидания); около 95% - в пределах 2-х σ, а в пределах 3-х σ находятся уже 99% значений. Убедиться в этом для стандартного нормального распределения можно записав формулу:

=НОРМ.СТ.РАСП(1;ИСТИНА)-НОРМ.СТ.РАСП(-1;ИСТИНА)

которая вернет значение 68,2689% - именно такой процент значений находятся в пределах +/-1 стандартного отклонения от среднего (см. лист График в файле примера ).

В силу четности функции плотности стандартного нормального распределения: f (x )= f (-х) , функция стандартного нормального распределения обладает свойством F(-x)=1-F(x). Поэтому, вышеуказанную формулу можно упростить:

=2*НОРМ.СТ.РАСП(1;ИСТИНА)-1

Для произвольной функции нормального распределения N(μ; σ) аналогичные вычисления нужно производить по формуле:

2* НОРМ.РАСП(μ+1*σ;μ;σ;ИСТИНА)-1

Вышеуказанные расчеты вероятности требуются для .

Примечание : Для удобства написания формул в файле примера созданы для параметров распределения: μ и σ.

Генерация случайных чисел

Сгенерируем 3 массива по 100 чисел с различными μ и σ. Для этого в окне Генерация случайных чисел установим следующие значения для каждой пары параметров:

Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию равной 25, можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .

В итоге будем иметь 3 столбца чисел, на основании которых можно, оценить параметры распределения, из которого была произведена выборка: μ и σ. Оценку для μ можно сделать с использованием функции СРЗНАЧ() , а для σ – с использованием функции СТАНДОТКЛОН.В() , см. файл примера лист Генерация .

Примечание : Для генерирования массива чисел, распределенных по нормальному закону , можно использовать формулу =НОРМ.ОБР(СЛЧИС();μ;σ) . Функция СЛЧИС() генерирует от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист Генерация ).

Задачи

Задача1 . Компания изготавливает нейлоновые нити со средней прочностью 41 МПа и стандартным отклонением 2 МПа. Потребитель хочет приобрести нити с прочностью не менее 36 МПа. Рассчитайте вероятность, что партии нити, изготовленные компанией для потребителя, будут соответствовать требованиям или превышать их.
Решение1 : =1-НОРМ.РАСП(36;41;2;ИСТИНА)

Задача2 . Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Согласно техническим условиям, трубы признаются годными, если диаметр находится в пределах 20,00+/- 0,40 мм. Какая доля изготовленных труб соответствует ТУ?
Решение2 : = НОРМ.РАСП(20,00+0,40;20,20;0,25;ИСТИНА)- НОРМ.РАСП(20,00-0,40;20,20;0,25)
На рисунке ниже, выделена область значений диаметров, которая удовлетворяет требованиям спецификации.

Решение приведено в файле примера лист Задачи .

Задача3 . Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Внешний диаметр не должен превышать определенное значение (предполагается, что нижняя граница не важна). Какую верхнюю границу в технических условиях необходимо установить, чтобы ей соответствовало 97,5% всех изготавливаемых изделий?
Решение3 : =НОРМ.ОБР(0,975; 20,20; 0,25) =20,6899 или
=НОРМ.СТ.ОБР(0,975)*0,25+20,2 (произведена «дестандартизация», см. выше)

Задача 4 . Нахождение параметров нормального распределения по значениям 2-х (или ).
Предположим, известно, что случайная величина имеет нормальное распределение, но не известны его параметры, а только 2-я процентиля (например, 0,5-процентиль , т.е. медиана и 0,95-я процентиль ). Т.к. известна , то мы знаем , т.е. μ. Чтобы найти нужно использовать .
Решение приведено в файле примера лист Задачи .

Примечание : До MS EXCEL 2010 в EXCEL были функции НОРМОБР() и НОРМСТОБР() , которые эквивалентны НОРМ.ОБР() и НОРМ.СТ.ОБР() . НОРМОБР() и НОРМСТОБР() оставлены в MS EXCEL 2010 и выше только для совместимости.

Линейные комбинации нормально распределенных случайных величин

Известно, что линейная комбинация нормально распределённых случайных величин x (i ) с параметрами μ(i ) и σ(i ) также распределена нормально. Например, если случайная величина Y=x(1)+x(2), то Y будет иметь распределение с параметрами μ(1)+ μ(2) и КОРЕНЬ(σ(1)^2+ σ(2)^2). Убедимся в этом с помощью MS EXCEL.

Определение. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности

Нормальный закон распределения также называется законом Гаусса .

Нормальный закон распределения занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения.

Можно легко показать, что параметры и, входящие в плотность распределения являются соответственно математическим ожиданием и среднеквадратическим отклонением случайной величиныХ .

Найдём функцию распределения F (x ) .

График плотности нормального распределения называется нормальной кривой или кривой Гаусса .

Нормальная кривая обладает следующими свойствами:

1) Функция определена на всей числовой оси.

2) При всех х функция распределения принимает только положительные значения.

3) Ось ОХ является горизонтальной асимптотой графика плотности вероятности, т.к. при неограниченном возрастании по абсолютной величине аргумента х , значение функции стремится к нулю.

4) Найдём экстремум функции.

Т.к. при y ’ > 0 при x < m и y ’ < 0 при x > m , то в точке х = т функция имеет максимум, равный
.

5) Функция является симметричной относительно прямой х = а , т.к. разность

(х – а ) входит в функцию плотности распределения в квадрате.

6) Для нахождения точек перегиба графика найдем вторую производную функции плотности.

При x = m +  и x = m -  вторая производная равна нулю, а при переходе через эти точки меняет знак, т.е. в этих точках функция имеет перегиб.

В этих точках значение функции равно
.

Построим график функции плотности распределения (рис. 5).

Построены графики при т =0 и трёх возможных значениях среднеквадратичного отклонения  = 1,  = 2 и  = 7. Как видно, при увеличении значения среднего квадратичного отклонения график становится более пологим, а максимальное значение уменьшается.

Если а > 0, то график сместится в положительном направлении, если а < 0 – в отрицательном.

При а = 0 и  = 1 кривая называется нормированной . Уравнение нормированной кривой:

      Функция Лапласа

Найдём вероятность попадания случайной величины, распределенной по нормальному закону, в заданный интервал.

Обозначим

Т.к. интеграл
не выражается через элементарные функции, то вводится в рассмотрение функция

,

которая называется функцией Лапласа или интегралом вероятностей .

Значения этой функции при различных значениях х посчитаны и приводятся в специальных таблицах.

На рис. 6 показан график функции Лапласа.

Функция Лапласа обладает следующими свойствами:

1) Ф(0) = 0;

2) Ф(-х) = - Ф(х);

3) Ф() = 1.

Функцию Лапласа также называют функцией ошибок и обозначают erf x .

Ещё используетсянормированная функция Лапласа, которая связана с функцией Лапласа соотношением:

На рис. 7 показан график нормированной функции Лапласа.

      Правило трёх сигм

При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трёх сигм .

Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины :

Если принять  = 3, то получаем с использованием таблиц значений функции Лапласа:

Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю.

Это правило называется правилом трёх сигм .

Не практике считается, что если для какой-либо случайной величины выполняется правило трёх сигм, то эта случайная величина имеет нормальное распределение.

Заключение по лекции:

В лекции мы рассмотрели законы распределения непрерывных величин В ходе подготовки к последующей лекции и практическим занятиям вы должны самостоятельно при углубленном изучении рекомендованной литературы и решения предложенных задач дополнить свои конспекты лекций.

Подставив φ(x)=π /4 ,f(x)=1/(b-a)

D[π /4]=( /720) ).

№319 Ребро куба x измерено приближенно, причем a . Рассматривая ребро куба как случайную величину X,распределенную равномерно в интервале (a,b),найти математическое ожидание и дисперсию объема куба.

1.Найдем математическое ожидание площади круга – случайной величины Y=φ(K)= - по формуле

M[φ(X)]=

Поставив φ(x)= ,f(x)=1/(b-a) и выполнив интегрирование, получим

M( )=
.

2.Найдём дисперсию площади круга по формуле

D [φ(X)]= - .

Подставив φ(x)= ,f(x)=1/(b-a) и выполнив интегрирование, получим

D = .

№320 Случайные величины X и Y независимы и распределены равномерно: X-в интервале (a,b),Y-в интервале (c,d).Найти математическое ожидание произведения XY.

Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий, т.е.

M(XY)=

№321 Случайные величины X и Y независимы и распределены равномерно: X- в интервале (a,b), Y – в интервале (c,d). Найти дисперсию произведения XY.

Воспользуемся формулой

D(XY)=M[

Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий, поэтому

Найдем M по формуле

M[φ(X)]=

Подставляя φ(x)= ,f(x)=1/(b-a) и выполняя интегрирование,получим

M (**)

Аналогично найдем

M (***)

Подставив M(X)=(a+b)/2, M(Y)=(c+d)/2 ,а так же (***) и (**) в (*),окончательно получим

D(XY)= -[ .

№322 Математическое ожидание нормально распределённой случайной величины X равно a=3 и среднее квадратическое отклонение σ=2.Написать плотность вероятности X.

Воспользуемся формулой:

f(x)= .

Подставляя имеющиеся значения получим:

f(x)= = f(x)= .

№323 Написать плотность вероятности нормально распределенной случайной величины X, зная, что M(X)=3, D(X)=16.

Воспользуемся формулой:

f(x)= .

Для того, чтобы найти значение σ воспользуемся свойством, что среднее квадратическое отклонение случайной величины X равно квадратному корню из ее дисперсии. Следовательно σ=4, M(X)=a=3. Подставляя в формулу получим

f(x)= = .

№324 Нормально распределенная случайная величина X задана плотностью

f(x)= . Найти математическое ожидание и дисперсию X.

Воспользуемся формулой

f(x)= ,

где a -математическое ожидание, σ -среднее квадратическое отклонение X. Из этой формулы следует, что a=M(X)=1 . Для нахождения дисперсии воспользуемся свойством, что среднее квадратическое отклонение случайной величины X равно квадратному корню из ее дисперсии. Следовательно D(X)= =

Ответ: математическое ожидание равно 1; дисперсия равна 25.

Бондарчук Родион

Дана функция распределения нормированного нормального закона . Найти плотность распределения f(x).

Зная, что , находим f(x).

Ответ:

Доказать, что функция Лапласа . нечетна: .

Произведем замену

Делаем обратную замену и получаем:

= =



Нормальный закон распределения (часто называемый законом Гаусса) играет исключительно важную роль в теории вероятностей и занимает среди других законов распределения особое положение. Это – наиболее часто встречающийся на практике закон распределения. Главная особенность, выделяющая нормальный закон среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях.

Можно доказать, что сумма достаточно большого числа независимых (или слабо зависимых) случайных величин, подчиненных каким угодно законам распределения (при соблюдении некоторых весьма нежестких ограничений), приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем большее количество случайных величин суммируется. Большинство встречающихся на практике случайных величин, таких, например, как ошибки измерений, ошибки стрельбы и т.д., могут быть представлены как суммы весьма большого числа сравнительно малых слагаемых – элементарных ошибок, каждая из которых вызвана действием отдельной причины, не зависящей от остальных. Каким бы законам распределения ни были подчинены отдельные элементарные ошибки, особенности этих распределений в сумме большого числа слагаемых нивелируются, и сумма оказывается подчиненной закону, близкому к нормальному. Основное ограничение, налагаемое на суммируемые ошибки, состоит в том, чтобы они все равномерно играли в общей сумме относительно малую роль. Если это условие не выполняется и, например, одна из случайных ошибок окажется по своему влиянию на сумму резко превалирующей над всеми другими, то закон распределения этой превалирующей ошибки наложит свое влияние на сумму и определит в основных чертах её закон распределения.

Теоремы, устанавливающие нормальный закон как предельный для суммы независимых равномерно малых случайных слагаемых, будут подробнее рассмотрены в главе 13.

Нормальный закон распределения характеризуется плотностью вероятности вида:

Кривая распределения по нормальному закону имеет симметричный холмообразный вид (рис. 6.1.1). Максимальная ордината кривой, равная , соответствует точке ; по мере удаления от точки плотность распределения падает, и при кривая асимптотически приближается к оси абсцисс.

Выясним смысл численных параметров и , входящих в выражение нормального закона (6.1.1); докажем, что величина есть не что иное, как математическое ожидание, а величина - среднее квадратическое отклонение величины . Для этого вычислим основные числовые характеристики величины - математическое ожидание и дисперсию.

Применяя замену переменной

Нетрудно убедиться, что первый из двух интервалов в формуле (6.1.2) равен нулю; второй представляет собой известный интеграл Эйлера-Пуассона:

. (6.1.3)

Следовательно,

т.е. параметр представляет собой математическое ожидание величины . Этот параметр, особенно в задачах стрельбы, часто называют центром рассеивания (сокращенно – ц. р.).

Вычислим дисперсию величины :

.

Применив снова замену переменной

.

Интегрируя по частям, получим:

Первое слагаемое в фигурных скобках равно нулю (так как при убывает быстрее, чем возрастает любая степень ), второе слагаемое по формуле (6.1.3) равно , откуда

Следовательно, параметр в формуле (6.1.1) есть не что иное, как среднее квадратическое отклонение величины .

Выясним смысл параметров и нормального распределения. Непосредственно из формулы (6.1.1) видно, что центром симметрии распределения является центр рассеивания . Это ясно из того, что при изменении знака разности на обратный выражение (6.1.1) не меняется. Если изменять центр рассеивания , кривая распределения будет смещаться вдоль оси абсцисс, не изменяя своей формы (рис. 6.1.2). Центр рассеивания характеризует положение распределения на оси абсцисс.

Размерность центра рассеивания – та же, что размерность случайной величины .

Параметр характеризует не положение, а самую форму кривой распределения. Это есть характеристика рассеивания. Наибольшая ордината кривой распределения обратно пропорциональна ; при увеличении максимальная ордината уменьшается. Так как площадь кривой распределения всегда должна оставаться равной единице, то при увеличении кривая распределения становится более плоской, растягиваясь вдоль оси абсцисс; напротив, при уменьшении кривая распределения вытягивается вверх, одновременно сжимаясь с боков, и становится более иглообразной. На рис. 6.1.3 показаны три нормальные кривые (I, II, III) при ; из них кривая I соответствует самому большому, а кривая III – самому малому значению . Изменение параметра равносильно изменению масштаба кривой распределения – увеличению масштаба по одной оси и такому же уменьшению по другой.