Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным




Скачать 166.74 Kb.
НазваниеКонтрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным
Дата публикации17.09.2014
Размер166.74 Kb.
ТипКонтрольная работа
literature-edu.ru > Информатика > Контрольная работа


Федеральное агентство по образованию
Тульский государственный университет
Кафедра «Автоматизированные станочные системы»

ТЕОРИЯ ВЕРОЯТНОСТЕЙ . МАТЕМАТИЧЕСКАЯ СТАТИСТИКА И СЛУЧАЙНЫЕ ПРОЦЕССЫ

Контрольная работа

Оценка параметров функции распределения и построение гистограммы по опытным данным
Методические указания

Направление подготовки: 230100 - Информатика и вычислительная техника ;

220200 - Автоматизация и управление
Форма обучения: очная

Тула 2008

1.Цель и задачи работы


Научить пользоваться методами математической статистики: оценкой параметров распределения случайных величин, построению гистограммы распределения по опытным данным и др.

2.Теоретические сведения

2.1.Статистическая функция распределения


Предположим, что изучается некоторая случайная величина Х, закон распределения которой в точности неизвестен, и требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина Х подчинена тому или иному закону. С этой целью над случайной величиной Х производятся ряд независимых опытов (наблюдений). В каждом из этих опытов величина Х принимает определенное значение. Совокупность наблюдённых значений величины и представляет собой первичный статистический материал, подлежащий обработке, осмыслению и анализу. Такая совокупность называется «простой статистической совокупностью» или «простым статистическим рядом». В литературе используется так же термин «выборка», имея ввиду, что из генеральной совокупности объектов берется выборка из нескольких объектов и над ними производятся соответствующие испытания или измерения. Обычно простая статистическая совокупность оформляется в виде таблицы с одним входом, в первом столбце которой стоит номер опыта i, а во втором — наблюдённое значение случайной величины.

Пример 1. Случайная величина T- время восстановления отказа станка. Восстановлено 10 отказов, при восстановлении каждого из них затрачено Ti минут времени. Результаты наблюдений сведены в простой статистический ряд.
Табл.2.1.

Простой статистический ряд


i

1

2

3

4

5

6

7

8

9

10

Ti,мин

35

15

66

43

21

165

300

247

52

35


Простой статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение статистической функции распределения случайной величины.

Статистической функцией распределения случайной величины T называется частота события T<t в данном статистическом материале. То есть

.

Для того чтобы найти значение статистической функции распределения при данном t, достаточно подсчитать число опытов, в которых величина T приняла значение, меньшее чем t, и разделить на общее число N произведенных опытов. То есть

,

где n(t)- число опытов, в которых T<t.

Для построения графика опытные данные располагают в возрастающем порядке, то есть

.

Такой упорядоченный ряд статистических данных называется вариационным рядом. - наименьшее значение, - наибольшее значение ,



размах выборки.

Пример 2. Построим статистическую функцию распределения для случайной величины T из предыдущего примера.

Табл.2.2

Вариационный ряд


i

1

2

3

4

5

6

7

8

9

10

T(i)

15

21

35

35

43

52

66

165

247

300


Размах выборки R=300-15=285 мин



Рис.2.1.График статистической функции распределения

2.2.Статистический ряд. Гистограмма



При большом числе наблюдений (порядка сотен) простая статистическая совокупность перестает быть удобной формой записи статистического материала - она становится слишком громоздкой и мало наглядной. Для придания ему большей компактности и наглядности статистический материал должен быть подвергнут дополнительной обработке - строится так называемый «статистический ряд». Предположим, что в нашем распоряжении результаты наблюдений непрерывной случайной величины Х, оформленные в виде простой статистической совокупности. Разделим весь диапазон наблюдённых значений на интервалы или «разряды» и подсчитаем количество значений Ni, приходящееся на каждый i-й разряд. Это число разделим на общее число наблюдений N и найдем частоту, соответствующую данному разряду:



Если разделить частоту на длину соответствующего интервала, то получим статистическую плотность

,

являющейся аналогом математической плотности распределения f(x).

Если случайная величина дискретна и целочисленна, то в качестве разрядов обычно принимаются возможные значения этой величины. В этом случае Ni - число реализаций, в которой X=i. Плотность f(x) и для дискретной случайной величины не определяется.

Статистический ряд обычно представляется в виде следующей таблицы:

N интерв.


1

2



I



k

Интервал


x0,x1

x1,x2



xi-1,xi



xk-1,xk

Число случаев

N1

N2




Ni




Nk

Частота

P1*

P2*



Pi*



Pk*

Плотость














Статистический ряд часто также оформляется графически в виде так называемой гистограммы. Гистограмма строится следующим образом. По оси абсцисс откладываются разряды, и на каждом из разрядов как их основании строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине разрядов высоты прямоугольников пропорциональны соответствующим частотам.

Из способа построения гистограммы следует, что полная площадь её равна единице.

Пример.1. Приведем гистограмму для длительностей простоя станков с числовым программным управлением (ЧПУ) TВ в связи с восстановлением отказов, построенную по данным статистического ряда, приведенного в ниже следующей таблице. Объем выборки N=193 достаточно большой, поэтому данные приведены в табл.2.3 в сгруппированном виде. Длина интервала 30 мин. Число интервалов k=15.

Таблица 2.3

Статистический ряд простоев станков с ЧПУ


N

инт.

Интервал,

мин

Число случаев

Частота

Плотность,

1/мин

1

0; 30

57

0.295

0.0098

2

30; 60

71

0.368

0.0122

3

60; 90

17

0.088

0.0029

4

90; 120

11

0.057

0.0019

5

120; 150

6

0.031

0.0010

6

150; 180

5

0.026

0.0009

7

180; 210

3

0.016

0.0005

8

210; 240

4

0.021

0.0007

9

240; 270

3

0.016

0.0005

10

270; 300

4

0.021

0.0007

11

300; 330

2

0.010

0.0003

12

330; 360

5

0.026

0.0009

13

360; 390

3

0.016

0.0005

14

390; 420

1

0.005

0.0002

15

420; 450

1

0.004

0.0002


По данным таблицы построен полигон распределения (рис.2.2) и гистограмма (рис.2.3).
Рис.2.2.Полигон распределения

Рис.2.3. Гистограмма статистического распределения.
Очевидно, что при увеличении числа опытов можно выбирать всё более и более мелкие разряды; при этом гистограмма будет всё более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Нетрудно убедиться, что эта кривая представляет собой график плотности распределения величины Tв.

Пользуясь данными статистического ряда, можно приближённо построить и статистическую функцию распределения величины Tв . Построение точной статистической функции распределения с несколькими сотнями скачков во всех наблюденных значениях трудоёмко и себя не оправдывает. Для практики обычно достаточно встроить статистическую функцию распределения по нескольким точкам. В качестве этих точек удобно взять границы разрядов, которые фигурируют в статистическом ряде. В этом случае
.

Соединяя полученные точки ломаной линией или плавной кривой, получим приближённый график статистической функции распределения. На рис.2.4 приведен такой график статистической функции распределения, построенный по данным табл.2.3.
Рис.2.3.График статистической функции распределения.
Если случайная величина дискретна, то в каждом значении X=i, функция распределения терпит скачек на величину соответственно.

2.3.Числовые характеристики распределения



Аналогом математического ожидания в статистике является среднее арифметическое наблюдённых значений случайной величины или статистическое среднее:



где n – число опытов. Согласно закону больших чисел при неограниченном увеличении числа опытов статистическое среднее приближается к математическому ожиданию. Подобные аналогии существуют для всех числовых характеристик. Будем обозначать их теми же буквами со звёздочкой.

Статистическая дисперсия:



- статистическое среднее.

Аналогично определяются статистические начальные и центральные моменты любых порядков:





Если число опытов слишком велико и приходится разбивать их на разряды, то получим приближённые формулы:



где - представитель i-го разряда, - частота i-го разряда, k – число разрядов.

2.4.Оценка параметров распределения



При обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения. Такая задача называется задачей выравнивания статистических рядов и состоит в подборе теоретической плавной кривой распределения, наилучшим образом описывающей данное распределение.

Наиболее часто применяется метод наименьших квадратов, при котором сумма квадратов отклонений обращается в минимум. Часто вид случайной функции известен заранее, и нужно лишь определить параметры этой функции. Для решения этой задачи часто применяют различные методы оценки параметров.

Чаще всего используют следующие методы:

  • метод моментов;

  • метод максимального правдоподобия.

2.4.1. Метод моментов.


Согласно методу моментов параметры распределения выбираются таким образом, чтобы моменты статистического распределения совпадали с соответствующими моментами предполагаемого закона распределения. Если предполагаемый закон распределения случайной величины X имеет один параметр, то он оценивается в результате решения уравнения

.

Если число параметров 2, то приравниваются первые два момента, в результате получаем систему из следующих двух уравнений для оценки неизвестных параметров распределения:

,

.

Если параметров 3, то приравниваются первые три момента и решают систему уже из трех уравнений и так далее.

Проиллюстрируем применения этого метода на конкретных примерах.

Пример 1. В результате наблюдений за работой станка были получены следующие значения наработки до отказа: . Известно, что наработка на отказ подчиняется показательному распределению с плотностью

.

Для этого распределения , а .

Таким образом, получаем следующую формулу для оценки параметра a показательного распределения по опытным данным:

.

Пример 2. В результате контроля размера X партии из N деталей были получены значения . Требуется оценить по этой выборке параметры распределения, в предположении его нормальности. Плотность нормального распределения имеет вид:

.

Это распределение имеет два параметра и , поэтому для их оценки имеем два уравнения, полученные отмеченным выше приравниванием математических ожиданий и дисперсий:



.

2.4.2.Метод наибольшего правдоподобия


Рассмотренный выше метод моментов приводит обычно к относительно простым формулам для оценки параметров, однако в ряде случаев эти оценки малоэффективны или вовсе несостоятельны. Например, для применения метода моментов теоретические моменты должны существовать, что не для всех распределений выполняется. Например, у распределения Коши, имеющего плотность

,

все моменты бесконечны.

Поэтому необходимы и другие методы, лишенные отмеченных недостатков.

Метод наибольшего правдоподобия обладает важным достоинством: он всегда приводит к состоятельным оценкам, имеющим наибольшую точность. Этот метод наилучшим образом использует всю информацию о неизвестных параметрах распределения, имеющуюся в выборке. Однако на практике он часто приводит к необходимости решать весьма сложные системы уравнений.

Метод наибольшего правдоподобия был предложен Р.Фишером, одним из основоположников математической статистики и является наиболее обоснованным и проверенным методом, широко используемом в математической статистике.

Случай дискретных распределений .Рассмотрим случай оценки параметра распределения дискретной случайной величины X, вероятности значений которой определяются согласно распределению , где - неизвестный параметр, который нужно оценить по выборке .


Функция



называется функцией правдоподобия. Если число случаев, когда случайная величина X приняла значения равно соответственно , где - размер выборки, то функция правдоподобия

.

Согласно методу наибольшего правдоподобия в качестве оценки неизвестного параметра принимается то значение, при котором функция правдоподобия принимает наибольшее значение для данной выборки. То есть в качестве оценки для берется наиболее вероятное значение для данной выборки.

Это значение находится в результате решения уравнения

.

Практически удобнее находить максимум функции ln(L), тогда соответствующее уравнение примет вид:

.

Это уравнение принято называть уравнением правдоподобия. Решение этого уравнения дает максимум функции правдоподобия, если для него выполняется условие

.

Если распределение имеет два пара параметра и , то есть имеет вид , то для оценки этих параметров используются система из двух уравнений правдоподобия:

.

При большем числе параметров число подобных уравнений соответственно увеличивается.

Проиллюстрируем применение метода наибольшего правдоподобия на примерах.

Пример 1. При n-кратном повторении опыта событие А проявилось m раз. Оценим вероятность события А по методу наибольшего правдоподобия. Будем считать, что случайная величина X принимает значение 1, если произошло событие А и 0, если произошло противоположное событие .

Согласно (8.1.1) функция правдоподобия в данном случае имеет вид:

,

где - оцениваемая вероятность.

После логарифмирования получаем, что

.

После дифференцирования по получаем следующее уравнение:

,

после решения которого получаем, что

.

Крышечкой сверху будем отличать оценку параметра от его точного значения.

Пример 2. Рассмотрим случай оценки параметра дискретной случайной величины Х, распределенной по закону Пуассона



Согласно (8.1.1) функция правдоподобия равна

.

После логарифмирования получаем

.

После дифференцирования получаем:

,

Откуда

,

где - статистическая вероятность того, что X=i.

Таким образом, в качестве оценки параметра а распределения Пуассона следует брать статистическое среднее выборки.

Случай непрерывных распределений. Если случайная величина X имеет непрерывную плотность распределения , где - параметр распределения, который нужно оценить по выборке реализаций этой случайной величины , то в этом случае функция правдоподобия


.

Согласно методу наибольшего правдоподобия наилучшей оценкой параметра является значение, для которого функция правдоподобия достигает максимума.

Если функция дифференцируема по , то это значение находится из уравнения

.

Практически удобнее пользоваться логарифмической формой этого уравнения

.

Это уравнение называется уравнением правдоподобия.

Если плотность распределения случайной величины X имеет два параметра и , то есть имеет вид , то оценки наибольшего правдоподобия находятся из системы двух уравнений



К сожалению, эти уравнения не всегда дают явные выражения для оценок параметров и их приходится решать численными методами.

Если область определения плотности зависит от параметров, то максимум функции правдоподобия может достигаться на границе этой области. В этом случае надо анализировать непосредственно функцию правдоподобия .

Если уравнение правдоподобия имеет несколько корней, то надо брать то решение, при котором функция правдоподобия максимальна.

Пример 3. Оценим данным методом параметр показательного распределения случайной величины T по выборке ее реализаций .

В этом случае , а функция правдоподобия

.

Уравнение правдоподобия в этом случае имеет вид:

.

В результате решения этого уравнения получаем, что оценка наибольшего правдоподобия

.

Пример 4. Оценим параметры случайной величины Х, распределенной по нормальному закону с плотностью



по выборке реализаций .

Функция правдоподобия в этом случае равна

,

а уравнения правдоподобия:





Из первого уравнения получаем, что

.

Из второго уравнения получаем, что

.

В данном случае оценки наибольшего правдоподобия совпали с ранее выведенными оценками по методу моментов. Но это не всегда так.

3.Задания на контрольно-курсовую работу



Задание на работу формулируется следующим образом: для заданного распределения по заданной выборке (X1,…,XN ) рассчитать параметры распределения и характеристики выборки: среднее арифметическое, квадратичное отклонение, медиану, моду, размах. Параметры распределения рассчитать методом моментов и желательно методом наибольшего правдоподобия. Построить гистограмму и статистическую функцию распределения. С использованием оцененных параметров построить график распределения (для дискретного распределения – решетчатую диаграмму, а для непрерывного распределения – график плотности распределения).

Варианты задания в данных методических указаниях не приводятся и выдаются преподавателем отдельно.

Пример исходных данных по варианту приведен ниже.

Задание N1

Распределения Пуассона случайной величины X


.

Выборка реализаций случайной величины Х:

2.00 2.00 1.00 3.00 3.00 1.00 3.00 2.00 4.00 4.00 2.00 5.00 2.00 1.00 2.00 3.00 2.00 4.00 1.00 3.00 1.00 1.00 1.00 3.00 2.00 3.00 5.00 3.00 1.00 3.00 5.00 2.00 1.00 3.00 1.00 2.00 6.00 1.00 1.00 2.00 2.00 2.00 0.00 2.00 0.00 2.00 1.00 1.00 1.00 1.00

4.Порядок выполнения работы


Работа выполняется с использованием калькулятора или компьютера. После получения от преподавателя задания студент дома знакомится с основными теоретическими положениями и проводит все необходимые расчеты по приведенным выше формулам. Все использованные формулы, расчеты и таблицы помещаются в отчет. Гистограмма и график теоретического распределения выполняются на миллиметровке или с использованием компьютера.

5.Оформление отчета


Отчет состоит из:

-титульного листа, форма которого приведена в прил.1;

-текста задания с исходной выборкой;

-необходимых таблиц, использованных формул и расчетов по ним;

-таблицы результатов расчета со значениями оцененных параметров, среднего значения, медианы, моды, квадратичного отклонения , размаха;

-пояснений к таблице с расшифровкой всех параметров ;

-графиков гистограммы, статистической функции распределения и графика плотности распределения.

7.Контрольные вопросы


1.Какая случайная величина называется дискретной, а какая – непрерывной?

2.Что такое простой статистический ряд или выборка ?

3.Что такое вариационный ряд?

4.Как определяется статистическая функция распределения ?

5.К чему стремится статистическая функция распределения с ростом размера выборки?

6.Как определяется размах выборки?

7.Как определяется статистическая плотность?

8.Чем отличается полигон распределения от гистограммы?

9.Как строится статистическая функция распределения по сгруппированным данным?

10.Как определяется статистическое математическое ожидание ?

11.Как определяется статистическая дисперсия ?

12.Как определяется статистический начальный момент порядка n?

13.Как определяется статистический центральный момент порядка n?

14.Как определяется статистическая медиана ?

15.Какие вы знаете методы оценки параметров распределений?

16.В чем заключается метод моментов при оценке параметров распределения?

17.В чем заключается метод максимального правдоподобия при оценке параметров распределения?

18.Какой метод оценки параметров распределений дает более точные оценки?

19.Сколько уравнений нужно составить для оценки параметров двухпарамет-рического распределения?

20.Как получаются уравнения для оценки параметров распределения по методу максимального правдоподобия?

?

3.

8.Литература по теме


1.Вентцель Е.С. Теория вероятностей.-М.: Наука,1969,-576с.

2.Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений.- М.: Наука, 1965.- 512 с.

Приложение 1.

Форма титульного листа




Тульский государственный университет


Кафедра "Автоматизированные станочные системы"

ТЕОРИЯ ВЕРОЯТНОСТЕЙ , МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

И СЛУЧАЙНЫЕ ПРЦЕССЫ

Контрольная работа.

Оценка параметров функции распределения и построение гистограммы по опытным данным
Студент гр._______________ ______________ _______________

(индекс группы) (подпись,дата) (ф.и.о.)

Преподаватель _________________ ______________

(подпись,дата) (ф.и.о.)

Тула - 200_




Приложение 2.


e426f36d

90cd104d

d16cdfd9
___________________________________________________________________

Разработал профессор кафедры АСС ТулГУ Пасько Н.И.

2 июня 2008 г

Добавить документ в свой блог или на сайт

Похожие:

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа № «Оценка факторов, влияющих на прибыль предприятия»
Работа выполняется на качественном (описательном) уровне и производится оценка влияния различных факторов различными методами (например,...

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа по предмету: бухгалтерское дело
Юридический анализ хозяйственных ситуаций, оценка их налоговых последствий и рисков их осуществления

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа контрольная работа
Профессия по спо: 140446. 03 Электромонтер по ремонту и обслуживанию электрооборудования ( по отраслям)

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа для учащихся 4 курса на основе осо, пто специальности...
Контрольная работа составлена в соответствии с рабочей программой, утверждённой директором нии бкс "26" апреля 2010

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconПорядок ведения и оформления тетрадей по русскому языку и литературе
Например: Проверочная работа. Самостоятельная работа. Контрольная работа. Работа над ошибками. Изложение. Сочинение

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа по дисциплине «Финансы»
Контрольная работа по дисциплине «Финансы» для групп заочного обучения направление подготовки: 080100. 62 «Экономика», профиль подготовки...

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconСистема построения и анализа графиков функций
Графики функций являются важным элементом решения множества различных задач. Это могут быть учебные, научные и практические. Начиная...

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа по математике показала, что уровень обученности...
В соответствии с планом, с целью контроля за качеством знаний обучающихся, уровнем сформированности классного коллектива, уровнем...

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconАвтоматизированная система дефектоскопии ферромагнитных изделий
Наличие неоднородностей и дефектов приводит к изменению топологии поля. Анализ распределения поля рассеяния вблизи поверхности позволяет,...

Контрольная работа Оценка параметров функции распределения и построение гистограммы по опытным данным iconКонтрольная работа (Мой
Работа должна быть иллюстрирована примерами из российской действительности и необходимым статистическим материалом. Обязательно нужно...

Литература


При копировании материала укажите ссылку © 2015
контакты
literature-edu.ru
Поиск на сайте

Главная страница  Литература  Доклады  Рефераты  Курсовая работа  Лекции