Университет "Проф. д-р Асен Златаров" - Бургас             Димитрова, Ж., Р. Димитрова. Система за обучение по статистика и статистически изчисления с Microsoft Excel 

Нормално разпределение

 Нормалното разпределение е теоретично разпределение, към което се приближават широк клас емпирични разпределения, отнасящи се за редица физични, социални и др. процеси. Това позволява свойствата на нормалното разпределение, което е непрекъснато разпределение, да се прилагат за емпиричните разпределения и да се правят оценки, изводи и прогнози за изследваните променливи (обекти и явления). 

Функцията на вероятностната плътност на нормално разпределена случайна величина е: 

,

където  е средната стойност;  - стандартното отклонение. Както се вижда, в аналитичния вид на  функцията участват две известни числа в историята на математиката: числото =3,14... и неперевото число e = 2,71.... Графиката на функцията се оприличава на камбана:

Кривата е разположена изцяло над абсцисната ос и е симетрична относно правата . Краищата на кривата продължават неограничено, без да се допират до оста Ox. Границите на функцията при са равни на 0, което означава, че абсцисната ос е хоризонтална асимптота. Със средствата на математическия анализ може да се пресметне, че лицето на фигурата, ограничена от нормалната крива и абсцисната ос, е 1

Всяко лице под нормалната крива, ограничено в интервала между кои да е две точки a и b на оста Ox, представлява вероятността случайната величина да приеме стойност в интервала [a, b]. Важно свойство на нормалното разпределение е, че лицето под нормалната крива между точките a и b на оста Ox може да бъде определено, ако се знаят неговата средна и стандартното му отклонение, т.е. има само едно нормално разпределение с дадена средна и стандартно отклонение.


Разпределения с равни средни и различни дисперсии Разпределения с равни дисперсии и различни средни

Стандартното нормално разпределение има функция на вероятностната плътност . Следващата фигура представя кривата на стандартното нормално разпределение, което има средна стойност 0 и стандартно отклонение 1, както и лицата под кривата, ограничени в някои интервали:

Като се изхожда от това, че стандартната нормалната крива е симетрична относно ординатната ос, може да се определят някои лица.

Лицето под  кривата, ограничено в интервала [-1, 1], e приблизително 0,683.

Лицето под  кривата, ограничено в интервала [-2, 2], e приблизително 0,954.

Лицето под  кривата, ограничено в интервала [-3, 3], e приблизително 0,997

Задача 1. Като използвате представените на горната фигура лица, пресметнете лицето под нормалната крива, ограничено в интервала:
а) [1; 3];    б) [-1; 2];    в) [-3; 1]. 
               Решение.
а) Лицето под нормалната крива в интервала [1; 3] съответства на обединението [1; 2] и [2; 3] и е равно на 0,1359 + 0,0215 = 0,1574. 

Лицето под нормалната крива на стандартното нормално разпределение за кои да е две точки a и b на оста Ox се намира като се използват съответни статистически таблици. За да получим лицата под кривата за нормални разпределения с различни средни и дисперсии, е необходимо те да се трансформират до стандартно нормално разпределение:

Нормална трансформация. Нормалната трансформация на данните от произволно нормално разпределение в стандартни единици z се получава чрез следните формули:

- за данните от генералната съвкупност;

 - за данните от извадката.

Стандартните единици показват с колко стандартни отклонения една стойност е по-малка или по-голяма от средната.

Задача 2. На следващата фигура е представена хистограма на разпределението на данните от извадка, съдържаща резултатите от тест за обща подготовка на ученици. Средният резултат от теста е 74 точки, а стандартното отклонение е 12 точки. Хистограмата, чиято хоризонтална ос е в брой точки, е сравнена с нормалната крива (хоризонталната  й ос е в стандартни единици z).

а) Превърнете в стандартни единици следните резултати: 98; 80; 56, 47;

б) Определете резултата, който е под средната с: 1,25; 2,5; 1,5 стандартни единици;

в) Определете резултата, който е над средната с: 2,5; 1,5; 2,25 стандартни единици.

Решение. а) z = (98 - 74) / 12 = 2 - полученият резултат 2 стандартни единици се вижда и от фигурата; z = (80 - 74) / 12 = 0,5 и т.н.

б) z = -1,25, тъй като е дадено, че резултатът е под средната или -1,25 = (x - 74) / 12. От формулата за z получаваме: x = – 1,25.12 + 74 = 59 точки.

в) z = 2,5, тъй като е дадено, че резултатът е над средната или 2,5 = (x - 74) / 12. От формулата за z получаваме: x = 2,5.12 + 74 = 104 точки.

Задача 3. Състезател участва във финалите на дисциплините дълъг скок и троен скок, като постига следните резултати: 8,62 м и 15,71 м. Определете в коя от двете дисциплини състезателят се е представил по-добре спрямо останалите състезатели, ако са известни средните стойности и дисперсиите за всяка една от дисциплините: дълъг скок: 8,02 и 0,64, троен скок: 15,32 и 2,25.

Решение. Превръщаме двата резултата в стандартни единици, които можем да сравним. За дисциплината дълъг скок z = (8,62 - 8,02) / 0,8 = 0,75; за дисциплината троен скок z = (15,71 - 15,32) / 1,5= 0,26. По-доброто представяне на състезателя е по дисциплината дълъг скок – резултатът му е над средното с 0,75 стандартни единици, докато при тройния скок резултатът му е над средното само с 0,26 стандартни единици.

Емпирично правило. Когато за дадена извадка е известно (или може да се предполага), че тя е получена от генерална съвкупност с нормално разпределение, за данните от извадката могат да се правят изводи без те да се трансформират в стандартни единици. Емпиричното правило, което свързва средната и стандартното отклонение е:

Приблизително 68% от всички данни са на разстояние не повече от 1 стандартно отклонение от средната.
Приблизително 95% от всички данни са на разстояние не повече от 2 стандартни отклонения от средната.
Почти всички данни (99,7%) са на разстояние не повече от 3 стандартни отклонения от средната.

Задача 4. Разпределението на  данните от една извадка се приближава до нормалното. Средната стойност на данните е 100, а дисперсията е 225. Определете интервала около средната стойност, в който се намират приблизително: а) 68% от данните; б) 95% от данните; в) 99,7% от данните. 

Решение. а) Съгласно познатото емпирично правило приблизително 68% от данните са на разстояние не повече от 1 стандартно отклонение от средното. Интервалът се определя от стойностите 100 - 15 = 85 и 100 + 15 = 115, т.е. интервалът е [85; 115];    б) Интервалът се определя от стойностите 100 – 2.15 = 70 и 100 + 2.15 = 130, т.е. интервалът е [70; 130].

Приложения на нормалното разпределение. В случаите, когато разпределението на данните от дадена извадка се приближава до нормалното разпределение, свойствата на нормалното разпределение може да се използват за решаване на различни задачи. При решаването на практически задачи е удобно да се използва статистическа таблица, в която са дадени лицата под кривата на стандартното нормално разпределение, ограничени между 0 (средната) и z:


Таблица 1 се съдържа във файла norm_distr.xlsx.

Някои приложения на нормалното разпределение в практиката ще илюстрираме със следващата

Задача 5. Установено е, че средното дневно количество вредни вещества, които завод "Х" изхвърля в атмосферата, е 1900 кг със стандартно отклонение 500 кг. Определете в какъв процент от дните се очаква количеството, което заводът изхвърля в атмосферата, да е: 

а) по-малко от 1900 кг; б) по-голямо от 2500 кг; в) между 1000 и 2500 кг.

Решение. а) Съгласно свойството на нормалното разпределение 50% от данните са под средната, т.е. през 50% от дните дневното количество ще бъде под 1900 кг.


б) Най-напред извършваме нормална трансформация - стойността 2500 преобразуваме в стандартни единици: z = (2500 - 1900) / 500 = 1,2 . От статистическата таблица намираме, че лицeто под нормалната крива, ограничено от средната 0 и z =1,2,  е 0,3849. Пресмятаме разликата 0,5 - 0,3849 = 0,1151 - в 11,51% от случаите (дните) количеството на вредните вещества ще бъде над 2500 кг. 

в) Най-напред пресмятаме z = (1000 - 1900) / 500 = -1,8 . От статистическата таблица намираме, че лицeто под нормалната крива, ограничено от средната и z = -1,8  е 0,4641, т.е. в 46,41% от дните количеството на вредните вещества ще бъде между 1000 и 1900 кг. От условие б) знаем, че в 38,49% от дните количеството на вредните вещества ще бъде между 1900 и 2500 кг. Изчисляваме сумата  0,4641 + 0,3849 = 0,849 - в 84,9% от случаите (дните) количеството на вредните вещества ще бъде между 1000 и 2500 кг. 


Функции в Excel за нормално разпределение

1. STANDARDIZE(x, средна стойност, стандартно отклонение). Функцията извършва нормална трансформация и връща z за произволно x. В следващия пример функцията ще върне резултат 1,2.

2. NORMSDIST(z). Изчислява функцията на разпределение на случайна величина със стандартно нормално разпределение за стойност z, т.е изчислява вероятността случайна величина да бъде по-малка от z. Графиката на функцията на разпределение при средна 0 и стандартно отклонение 1 има вида:

Например, NORMSDIST(1,2) ще върне резултат 0,88493. Тази функция може да се използва за определяне на вероятностите (лицата под нормалната крива) вместо статистическите таблици. Например, за решаване на Задача 5 функцията трябва да се използва по следния начин:

а) = NORMSDIST(0) - връща резултат 0,5;

б) = 1 - NORMSDIST(1,2) - връща резултат 0,11507, равен на 1 - 0,88493;

в) = NORMSDIST(1,2) - NORMSDIST(-1,8) - резултатът е 0,849, равен на 0,88493 - 0,03593.

3. NORMDIST(x, средна стойност, стандартно отклонение, кумулация). При кумулация False се връща функцията на вероятностната плътност, а при True - функцията на разпределение на нормално разпределена случайна величина. 

Удобно е въвеждането на функцията  NORMDIST да се извършва с помощника за въвеждане на функции Insert Function - стартира се с бутона fx:

Адресите на клетките със средната и стандартното отклонение може да се зададат като абсолютни адреси (чрез клавиша F4), когато е необходимо да се копират формулите в съответните клетки.

Приложения на функцията NORMDIST: създаване на табличен вид на функциите за нормално разпределение, въз основа на който да се построят съответните графики; определяне на вероятностите случайната величина да бъде по-малка или по-голяма от конкретна стойност, както и да се намира в даден интервал. Функцията  NORMDIST може да се използва за определяне на вероятностите вместо съответните статистически таблици, при това не е необходимо да се извършва нормална трансформация.

Например, за решаване на Задача 5 функцията ще се използва по следния начин:

а) =NORMDIST(1900;1900;500;TRUE)

б) =1 - NORMDIST(2500;1900;500;TRUE)

в) =NORMDIST(2500;1900;500;TRUE) - NORMDIST(1000;1900;500;TRUE)

Във файла norm_distr.xls е даден модел за построяване на графиките на функциите за нормално разпределение и за намиране на вероятностите за конкретни стойности на изследваната променлива - използвана е функцията NORMDIST. Потребителят може да променя параметрите на модела и да изследва резултатите.


4. NORMINV(вероятност, средна стойност, стандартно отклонение). Функцията изчислява от зададените вероятност, средна стойност и стандартно отклонение стойността x на нормално разпределение, за която е изпълнено P(X<x). 

Например, за Задача 5 стойността x, под която се намират 90%  от стойностите на разпределението ще се бъде 2540,775:

В същия файл norm_distr.xlsx е даден модел за построяване на табличен вид на функцията на вероятностната плътност и функцията на разпределение на две нормално разпределени случайни величини с еднакви средни и различни стандартни отклонения, които потребителят може да променя и да изследва графиките на функциите.

Двете графики - на функцията на вероятностната плътност и на функцията на разпределение отново илюстрират извода - колкото по-малко е стандартното отклонение, толкова по-малки са отклоненията на стойностите на разпределението от тяхната средна.