Информационная система
«Ёшкин Кот»

XXXecatmenu

ФЕДЕРАЛЬНОЕ АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ГОСТ Р
50779.24-2005
(ИСО 8595:1990)

 

СТАТИСТИЧЕСКИЕ МЕТОДЫ

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

ОЦЕНКА МЕДИАНЫ

ISO 8595:1990
INTERPRETATION OF STATISTICAL DATA - ESTIMATION OF A MEDIAN
(MOD)

 

Москва
Стандартинформ
2005

 

 

Предисловие

Задачи, основные принципы и правила проведения работ по государственной стандартизации в Российской Федерации установлены ГОСТ Р 1.0-92 «Государственная система стандартизации Российской Федерации. Основные положения» и ГОСТ Р 1.2-92 «Государственная система стандартизации Российской Федерации. Порядок разработки государственных стандартов»

Сведения о стандарте

1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК125 «Статистические методы в управлении качеством продукции» на основе собственного аутентичного перевода стандарта, указанного в пункте 4

2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. № 112-ст

4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 8595:1990 «Статистические методы. Статистическое представление данных. Оценка медианы» (ISO 8595:1990 «Interpretation of statistical data - Estimation of a median», MOD), путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5 (подраздел 3.6)

5 ВВЕДЕН ВПЕРВЫЕ

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Статистические методы

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

Оценка медианы

Interpretation of statistical data - Estimation of a median

Дата введения - 2005-07-01

1 Область применения

Настоящий стандарт устанавливает процедуру определения точечной оценки и доверительного интервала для медианы распределения вероятностей случайной величины. Оценки основаны на случайной выборке объема n из генеральной совокупности. Представленная процедура дает метод оценки, свободный от вида распределения, и может быть применена для оценки квартилей и других процентилей (квантилей).

2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 50779.10-2000 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, ITD)

ГОСТ Р 50779.22-2005 (ИСО 2602:1980) Статистические методы. Статистическое представление данных. Точечная оценка и доверительный интервал для среднего (ИСО 2602:1980 «Статистическое представление результатов испытаний. Оценка среднего. Доверительный интервал», MOD)

Примечания

1 Настоящий раздел является дополнительным по отношению к содержанию международного стандарта ИСО 8595:1990 (ISO 8595:1990) и включен для учета основополагающих национальных стандартов в области статистических методов.

2 При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться замененным (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяют в части, не затрагивающей эту ссылку.

3 Термины и определения

В настоящем стандарте применены термины по ГОСТ Р 50779.10, а также следующие термины с соответствующими определениями:

3.1 kпорядковая статистика в выборке объема n (k-th order statistic of a sample of size n): k-e значение х[k] в выборке из n значений, расположенных в неубывающем по величине порядке.

х[1] £ х[2] £ ... £ х[n].                                                     (1)

3.2 медиана непрерывного распределения вероятностей (median of a continuous probability distribution), M (или х[0,5]): Значение М, удовлетворяющее соотношению

F(M) = 0,5,                                                        (2)

где F(х) - функция распределения генеральной совокупности.

4 Условия применения метода

Метод, представленный в настоящем стандарте, может быть применен для любых непрерывных распределений при условии, что выборка является случайной.

Примечание - Если распределение генеральной совокупности близко к нормальному, то медиана совпадает со средним значением. Доверительные границы в этом случае могут быть рассчитаны в соответствии с ГОСТ Р 50779.22.

Если условия корректного применения метода выполняются, число k выборочных значений, которое не превышает заданного процентиля генеральной совокупности, является реализацией случайной переменной К, которую можно описать биномиальным законом распределения:

                                     (3)

где n - объем выборки;

р - вероятность появления выборочного значения, не превышающего заданного процентиля;

Р - вероятность появления k выборочных значений, не превышающих заданного процентиля, в выборке объема n.

В случае медианы, для р = 0,5, биномиальное распределение имеет вид

                                              (4)

5 Точечная оценка

Точечной оценкой медианы генеральной совокупности является выборочная медиана. Выборочную медиану находят путем нумерации элементов выборки, расположенной в порядке неубывания, и выбора значения:

- [(n + 1 )/2]-й порядковой статистики, если n - нечетное;

- среднего арифметического [n/2]-й и [n/2 + 1]-й порядковой статистики, если n - четное.

Примечание - Эта оценка обычно смещенная; в общем случае произвольной генеральной совокупности несмещенной оценки не существует.

6 Доверительный интервал

6.1 Общие положения

Двусторонний доверительный интервал для медианы генеральной совокупности является закрытым интервалом вида

[T1, T2],

где T1 < T2;

T1 и Т2 называются нижней и верхней доверительными границами соответственно.

Односторонние доверительные интервалы могут быть двух видов:

[T1, )

или (-, Т2],

где Т1 и Т2 называются нижней и верхней доверительными границами соответственно.

Практическое значение применения доверительных интервалов состоит в том, что использование доверительного интервала позволяет экспериментатору с высокой степенью достоверности утверждать, что неизвестный оцениваемый параметр М лежит внутри доверительного интервала и вероятность нахождения М вне интервала незначительна. Вероятность того, что найденный по случайной выборке доверительный интервал накрывает истинное значение М медианы генеральной совокупности, называется доверительной вероятностью.

6.2 Стандартный метод

Верхнюю и нижнюю границы двустороннего доверительного интервала с доверительной вероятностью 1 - a/2 определяют с помощью двух порядковых статистик [k], х[п-k+1], где целочисловое k находят из условий:

                                                        (5)

                                                        (6)

В случае одностороннего доверительного интервала a/2 необходимо заменить на a. Решения неравенств для различных значений n приведены в таблице 1.

Таблица 1 - Точные значения k для объема выборки п

п

Односторонний доверительный интервал

Двусторонний доверительный интервал

Доверительная вероятность

0,95

0,99

0,95

0,99

5

1

0

0

0

6

1

0

1

0

7

1

1

1

0

8

2

1

1

1

9

2

1

2

1

10

2

1

2

1

11

3

2

2

1

12

3

2

3

2

13

4

2

3

2

14

4

3

3

2

15

4

3

4

3

16

5

3

4

3

17

5

4

5

3

18

6

4

5

4

19

6

5

5

4

20

6

5

6

4

21

7

5

6

5

22

7

6

6

5

23

8

6

7

5

24

8

6

7

6

25

8

7

8

6

26

9

7

8

7

27

9

8

8

7

28

10

8

9

7

29

10

8

9

8

30

11

9

10

8

Примечание - Знак «0» показывает, что доверительный интервал и доверительные границы для данного объема выборки и данной доверительной вероятности не могут быть определены.

Для 5 £ n £ 30 и для обычно используемых значений 1 - a (и для односторонних и для двусторонних доверительных интервалов) значение k определяют из условий:

T1 = x[k],                                                                  (7)

T2 = x[n-k+1],                                                                 (8)

где х[1], х[2].....х[п] - упорядоченная выборка.

Для малых значений n доверительные границы могут не существовать.

6.3 Приближенный метод

Для тех значений п, которые не приведены в таблице 1, приближенное значение k можно получить, используя формулу

                                          (9)

тогда k - целая часть у, а и - квантиль стандартного нормального распределения, который определяют как

и = u1-a - для одностороннего интервала;

и = u1-a/2 - для двустороннего интервала.

Это приближение является весьма точным для обычно используемых значений a.

При компьютерных расчетах для получения приближенного значения k применяют формулу (10), согласованную с таблицей 1 и с более простой формулой (9), и используют для значений п, превышающих значения, представленные в таблице 1:

                                   (10)

тогда k - это целая часть у.

Примеры

1 Электрический шнур небольшого электрического прибора испытывают на испытательной машине на многократный изгиб до отказа. Испытания моделируют реальную эксплуатацию шнура. Испытания являются ускоренными. Ниже представлена выборка, состоящая из 24 наработок до отказа в часах; семь значений выборки, отмеченных звездочками, являются цензурированными:

57,5; 77,8; 88,0; 96,9; 98,4; 100,3; 100,8; 102,1; 103,3;

103,4; 105,3; 105,4; 122,6; 139,3; 143,9; 148,0; 151,3;

161,1*; 161,2*; 161,2*; 162,4*; 162,7*; 163,1*; 176,8*.

На основании представленной выборки получают точечную оценку медианы распределения наработки до отказа

(x[12] + x[13]) /2 = (105,4 + 122,6)12 = 114.                            (11)

Нижнюю доверительную границу одностороннего доверительного интервала для доверительной вероятности 0,95 находят следующим образом: сначала из таблицы 1 для n = 24 определяют значение k = 8, а затем в представленной выше упорядоченной выборке находят значение х[8] = 102,1, которое принимают в качестве искомой нижней доверительной границы.

2 Наработки до отказа 34 транзисторов, полученные по результатам ускоренных испытаний и измеренные в неделях, представлены ниже. Три значения, отмеченные звездочками, являются цензурированными:

3; 4; 5; 6; 6; 7; 8; 8; 9; 9; 9; 10; 10; 11; 11; 11; 13; 13; 13; 13; 13;

17; 17; 19; 19; 25; 29; 33; 42; 42; 52; 52*; 52*; 52*.

На основании представленной выборки вычисляют точечную оценку медианы распределения наработки до отказа

[17] + х[18]) / 2 = (13 + 13) / 12 = 13.                                (12)

Начиная с n > 30 для получения нижней границы одностороннего доверительного интервала для медианы вынужденно используют приближенный метод; для доверительной вероятности 0,95 получают

                                      (13)

k - целая часть у, следовательно,

k = 12

и искомая доверительная граница

x[12] = 10.

Можно показать, что найденное таким образом значение k совпадает со значением, полученным точным методом.

Для двусторонних доверительных границ:

                                   (14)

тогда k = 11; n - k + 1 = 24 и получают доверительный интервал

[x[11], x[24]] = [9, 19].                                                   (15)

 

Ключевые слова: статистический анализ, случайная выборка, оценивание, доверительный интервал, порядковая статистика, медиана

 

СОДЕРЖАНИЕ

 



© 2013 Ёшкин Кот :-)