Реферат: Теория вероятности
Интегрированная функция описывает распределение вероятности полной группы событий, поэтому ее общая площадь в пределах изменения t от до равна 1.
Поскольку функция асимптотически приближается к оси абсцисс в пределах изменения t от до -5, а так же от +5 до считается, что единице равна площадь кривой в пределах ординат .
Значения функции даны в приложении 3, они указаны в пределах от –t до +t.
Пример: от 80 до 120
Таким образом, в 84 случаях из 100.
Складывая и вычитая площади, определенные по таблицам всегда можно получить необходимый результат.
12. Зависимые события. Гипергеометрическое распределение.
Для вывода функции гипергеометрического распределения проводятся испытания (выборка) по схеме невозвращающегося шара. В этом случае вероятность появления события Е k-раз в n зависимых испытаниях подвергается влиянию не только числа отбираемых единиц n, но и численности всей генеральной совокупности N.
Если p доля единиц генеральной совокупности, обладающих изучаемым признаком, а q – доля необладающих этим признаком, то вероятность появления события Е k раз n зависимых испытаний определяется по формуле:
, где - число сочетаний из pN=M элементов генеральной совокупности, обладающих изучаемым признаком по k; - число сочетаний из qN=N-M единиц, необладающих изучаемым признаком n-k единиц; - число исходов, удовлетворяющих и неудовлетворяющих данному испытанию.
Математическое ожидание гипергеометрического распределения не зависит от объема генеральной совокупности и как в биномиальном распределении определяется по формуле:
, где - корректирует дисперсию при бесповторном отборе в зависимости от численности выборки и генеральной совокупности.
Если численность генеральной совокупности достаточно велика, то , в этом случае , то , то есть, зная параметры биномиального распределения всегда можно рассчитать параметры гипергеометрического.
13. Нормальное распределение.
Нормальное распределение – это наиболее важный вид распределения в статистике.
Нормально распределяются значения признака под воздействием множества различных причин, которые практически не взаимосвязаны друг с другом и влияние каждой из которых сравнительно мало, по сравнению с действием всех остальных факторов.
Нормальное распределение отражает вариацию значений признака у единиц однородной совокупности. Подобное распределение наблюдается преимущественно в естественно-научных испытаниях (измерение роста, веса).
В социально-экономических явлениях нормального распределения данные встречаются редко. Здесь всегда присутствуют причины существенным образом влияющие на уровень изучаемого признака (результат управленческого воздействия).
Тем не менее, гипотеза о нормальном распределении исходных данных лежит в основе методологии анализа взаимосвязей выборочного метода и многих других статистических методов.
При достаточно большом числе испытаний нормальная кривая служит пределом, к которому стремятся многие виды распределения, в том числе биномиальное и гипергеометрическое.
Нормальное распределение выражается функцией вида:
Данная функция характеризует плотность нормального распределения вероятности, ее математическое ожидание , а показатель степени – стандартное значение отклонений эмпирических данных от среднеарифметических.
Масштабирование данных кривой по оси x осуществляется величинами среднеквадратического отклонения . Так как показатель степени функции возведет в четную степень, функция положительна, кривая симметрична относительно средней, то есть показатель асимметрии равен . Показатель эксцесса кривой нормального распределения так же равен 0.
Значения параметров и влияют на форму и положение графика на координатной плоскости. С изменением при кривая скользит вдоль оси x. С изменением при чем больше тем более плосковершинной становится нормальная кривая. Нормальная кривая имеет точки перегиба с координатами . Площадь, ограниченная функцией и ординатами, проведенными из точек с координатами:
составляет 0,6827 площади всей кривой;
- 0,9545 площади всей кривой;
- 0,9973 площади всей кривой.
14. Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона.
Нормальный характер распределения свидетельствует о количественной однородности статистических данных и об отсутствии каких-либо причин существенным образом определяющих вариацию изучаемого явления.
Поэтому статистический анализ нередко начинается с проверки того, как фактически (эмпирически) данные ложатся на идеальную теоретическую кривую или апроксимируются (то есть выражение данных какой-либо кривой) сравнение эмпирических и теоретических данных. Производится путем оценки гипотезы нормального характера распределения. Вероятностные статистические предположения выдвигаются в виде нулевой гипотезы. Отклонения данных эмпирических от нормальных носят случайный характер. Оценку нулевой гипотезы в данном случае осуществляют графическим методом или путем расчета специальных обобщающих показателей сходства, называемых критериями согласия.
Независимо от выбранного метода генеральные ряды распределения преобразуются в дискретные и стандартизируются.
Пример: Известно, что среднемесячная заработная плата всех рабочих =1402,42 руб., среднеквадратическое отклонение =338,58 руб.
Данные распределения среднемесячной заработной платы.
Средне-месячная заработная плата |
Число раб-ков, (эмпир.) |
(теор.) |
|||||||
До 700 | 16 | 600 | -2,37 | -2,81 | 0,0241 | 12,93 | 3,07 | 9,41 | 0,73 |
700,1-900 | 56 | 800 | -1,78 | -1,58 | 0,0819 | 44,04 | 11,96 | 142,95 | 3,25 |
900,1-1100 | 89 | 1000 | -1,19 | -0,71 | 0,1969 | 105,82 | -16,82 | 282,90 | 2,67 |
1100,1-1300 | 172 | 1200 | -0,60 | -0,18 | 0,3337 | 179,35 | -7,35 | 54,05 | 0,30 |
1300,1-1500 | 244 | 1400 | -0,01 | 0,00 | 0,3989 | 214,44 | 29,56 | 873,70 | 4,07 |
1500,1-1700 | 163 | 1600 | 0,58 | -0,17 | 0,3365 | 180,87 | -17,87 | 319,44 | 1,77 |
1700,1-1900 | 93 | 1800 | 1,17 | -0,69 | 0,2002 | 107,62 | -14,62 | 213,80 | 1,99 |
1900,1-2100 | 64 | 2000 | 1,76 | -1,56 | 0,0840 | 45,17 | 18,83 | 354,42 | 7,85 |
Свыше 2100,1 | 13 | 2200 | 2,36 | -2,77 | 0,0249 | 13,38 | -0,38 | 0,14 | 0,01 |
Итого | 910 | 22,63 |
В связи с тем, что табличные значения рассчитаны для непрерывно изменяющегося признака с дисперсией равной 1, необходимо скорректировать полученные частости на фактическую величину интервала и среднеквадратическое отклонение.
, где величина интервала. Так как все интервалы равны , тогда .
Графики не позволяют определить насколько существенны отклонения, поэтому более точным считается способ расчета критериев согласия. Наиболее известный из них:
В соответствии с формулой, чем сильнее совпадение кривых, тем меньше величина . При отсутствии отклонений , но даже при небольших отклонениях величина зависит от числа слагаемых (то есть от числа групп). Если >0, то необходима его вероятностная оценка (стр. 368).
- число степеней свободы и заданная вероятность несущественности отклонений эмпирических данных и теоретических. r – число групп, k - число параметров, которые нельзя изменить.
Поскольку фактическое значение (22,63) гораздо больше табличного (5,348) даже для вероятности 0,5, гипотеза о случайном характере отклонений эмпирических данных от теоретических отклоняется.