72 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Уровень надежности статистика

Вычисление показателей описательной статистики

3.1. Инструмент Описательная статистика позволяет вычислить основные показатели описательной статистики для одного и более массивов данных.

3.2. Вызовите инструмент создания выборки через Данные>Анализ данных>Описательная статистика.

3.3. Параметры диалогового окна Описательная статистика имеют следующий смысл (http://yuschikev.narod.ru/psk13/lection2-7.html).
Входной диапазон – блок ячеек, содержащий значения исследуемого показателя. Надо ввести ссылку на ячейки, содержащие анализируемые данные. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк.
Группирование определяет ориентацию блока исходных данных на рабочем листе. Для его определения надо установить переключатель в положение По столбцам или По строкам в зависимости от расположения данных во входном диапазоне.
Метки – наличие имен в блоке ячеек. Для его определения надо установить переключатель в положение Метки в первой строке (столбце), если первая строка (столбец) во входном диапазоне содержит названия столбцов. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
Уровень надежности указывает процент надежности данных для вычисления доверительного интервала. Для его определения надо установить флажок и в поле ввести требуемое значение. Например, значение 95% вычисляет уровень надежности среднего со значимостью 0.05.
К-ый наибольший – порядковый номер наибольшего после максимального значения. Установить флажок, если в выходную таблицу необходимо включить строку для k-го наибольшего значения для каждого диапазона данных. В соответствующем окне ввести число k. Если k равно 1, эта строка будет содержать максимум из набора данных.
К-ый наименьший – порядковый номер наименьшего после минимального значения. Установить флажок, если в выходную таблицу необходимо включить строку для k-го наименьшего значения для каждого диапазона данных. В соответствующем окне ввести число k. Если k равно 1, эта строка будет содержать минимум из набора данных.
Вывод описательной статистики осуществляется по месту указания в поле Выходной диапазон. Здесь надо ввести ссылку на левую верхнюю ячейку выходного диапазона. Этот инструмент анализа выводит два столбца сведений для каждого набора данных. Левый столбец содержит метки статистических данных; правый столбец содержит статистические данные. Состоящий их двух столбцов диапазон статистических данных будет выведен для каждого столбца (строки) входного диапазона в зависимости от положения переключателя Группирование.
Для изменения места вывода результатов можно установить переключатель Новый рабочий лист, чтобы открыть новый лист и вставить результаты, начиная с ячейки A1. Можно ввести имя нового листа в поле, расположенном напротив соответствующего положения переключателя. Если установить переключатель Новая книга, то открывается новая книга, и результаты вставляются в ячейку A1 на первом листе в этой книге.
Итоговая статистика – полный вывод показателей описательной статистики. Для его определения надо установить флажок, если в выходном диапазоне необходимо получить по одному полю для каждого из следующих видов статистических данных: Среднее, Стандартная ошибка (среднего), Медиана, Мода, Стандартное отклонение, Дисперсия выборки, Эксцесс, Асимметричность, Интервал, Минимум, Максимум, Сумма, Счет, Наибольшее (#), Наименьшее (#), Уровень надежности.

3.4. В качестве Входного интервала укажите созданную выборку $D$4:$D$33.УкажитеВыходной интервалравный$F$4.Поставьте галочки на параметрах Итоговая статистикаиУровень надежности, К-ый наименьший и К-ый наибольший.НажмитеOK.На странице выведутся показатели описательной статистики (также, данные параметры можно вычислить с помощью встроенных функций Excel).

Описательная статистика

Одним из наиболее часто используемых средством в Пакете анализа является «Описательная статистика», которая позволяет быстро и просто вычислить основные статистические характеристики одномерных выборок и создает отчет, содержащий рассчитанные статистки по представленной выборке.

На рисунке 4.1 показан рабочий лист, содержащий три ряда данных (три независимые выборки, имеющие разные распределения), и диалоговое окно «Описательная статистика».

В диалоговом окне данного режима (рис. 4.1) задаются следующие параметры:

1. Входной интервал – указывается диапазон ячеек, в котором содержатся данные.

2. Группирование — демонстрируется, сгруппированы ли данные, и если сгруппированы, то по столбцам или строкам.

3. Метки в первой строке/Метки в первом столбце – устанавливается, если задается входной диапазон данных вместе с заголовками.

Читать еще:  Как пользоваться банкоматом втб

4. Выходной интервал/Новый рабочий лист/Новая рабочая книга – указывается, куда будут выводиться результаты расчетов.

5. Итоговая статистика — устанавливается в активное состояние, если в выходном диапазоне необходимо получить по одному полю для всех показателей описательной статистики.

Рисунок 4.1. Три выборки и диалоговое окно «Описательная статистика»

Установка флажка Итоговая статистика указывает, что в итоговом отчете этого средства будут вычислены все статистические характеристики выборки, за исключением границы доверительного интервала для среднего и К-х наибольших и наименьших значений, для которых имеются отдельные опции: Уровень надежности, К-ый наименьший и К-ый наибольший. Если флажок Итоговая статистика не установлен, то выводится только то, что задается с помощью опций Уровень надежности, К-ый наименьший и К-ый наибольший.

Опция Уровень надежности указывает, надо ли вычислять границу доверительного интервала для среднего. В поле ввода рядом с этой опцией задается доверительный уровень в процентах.

В полях ввода рядом с опциями К-ый наибольший и К-ый наименьший указываются порядки выводимых наибольшего и наименьшего значений. Если эти порядки равны 1, то выводятся соответственно максимальное и минимальное выборочные значения.

Если имеются выборки разных размеров, то средство «Описательная статистика» правильно определяет размеры выборок, игнорируя пустые ячейки.

На рисунке 4.2 показан рабочий лист с результатами расчетов.

Рис.4.2. Результаты работы средства «Описательная статистика»

В таблице 4.2 приведены вычисляемые средством Описательная статистика статистические характеристики выборок, а также функции, которые возвращают те же самые характеристики.

Выборочные характеристики, вычисляемые средством «Описательная статистика»

Уровень значимости и уровень надежности в MS EXCEL

Дадим определение терминам уровень надежности и уровень значимости. Покажем, как и где они используется в MS EXCEL .

СОВЕТ : Для понимания терминов Уровень значимости и Уровень надежности потребуется знание следующих понятий:

Уровень значимости статистического теста – это вероятность отклонить нулевую гипотезу , когда на самом деле она верна. Другими словами, это допустимая для данной задачи вероятность ошибки первого рода (type I error).

Уровень значимости обычно обозначают греческой буквой α ( альфа ). Чаще всего для уровня значимости используют значения 0,001; 0,01; 0,05; 0,10.

Например, при построении доверительного интервала для оценки среднего значения распределения , его ширину рассчитывают таким образом, чтобы вероятность события « выборочное среднее (Х ср ) находится за пределами доверительного интервала » было равно уровню значимости . Реализация этого события считается маловероятным (практически невозможным) и служит основанием для отклонения нулевой гипотезы о равенстве среднего заданному значению .

Ошибка первого рода часто называется риском производителя. Это осознанный риск, на который идет производитель продукции, т.к. он определяет вероятность того, что годная продукция может быть забракована, хотя на самом деле она таковой не является. Величина ошибки первого рода задается перед проверкой гипотезы , таким образом, она контролируется исследователем напрямую и может быть задана в соответствии с условиями решаемой задачи.

Чрезмерное уменьшение уровня значимости α (т.е. вероятности ошибки первого рода ) может привести к увеличению вероятности ошибки второго рода , то есть вероятности принять нулевую гипотезу , когда на самом деле она не верна. Подробнее об ошибке второго рода см. статью Ошибка второго рода и Кривая оперативной характеристики .

Уровень значимости обычно указывается в аргументах обратных функций MS EXCEL для вычисления квантилей соответствующего распределения: НОРМ.СТ.ОБР() , ХИ2.ОБР() , СТЬЮДЕНТ.ОБР() и др. Примеры использования этих функций приведены в статьях про проверку гипотез и про построение доверительных интервалов .

Уровень надежности

Уровень доверия (этот термин более распространен в отечественной литературе, чем Уровень надежности ) — означает вероятность того, что доверительный интервал содержит истинное значение оцениваемого параметра распределения.

Уровень доверия равен 1-α, где α – уровень значимости .

Термин Уровень надежности имеет синонимы: уровень доверия, коэффициент доверия, доверительный уровень и доверительная вероятность (англ. Confidence Level , Confidence Coefficient ).

В математической статистике обычно используют значения уровня доверия 90%; 95%; 99%, реже 99,9% и т.д.

Например, Уровень доверия 95% означает, что событие, вероятность которого 1-0,95=5% исследователь считать маловероятным или невозможным. Разумеется, выбор уровня доверия полностью зависит от исследователя. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

Примечание : Стоит отметить, что математически не корректно говорить, что Уровень доверия является вероятностью, того что оцениваемый параметр распределения принадлежит доверительному интервалу , вычисленному на основе выборки . Поскольку, считается, что в математической статистике отсутствуют априорные сведения о параметре распределения. Математически правильно говорить, что доверительный интервал , с вероятностью равной Уровню доверия, накроет истинное значение оцениваемого параметра распределения.

Читать еще:  Заявление на без содержание

Уровень надежности в MS EXCEL

В MS EXCEL Уровень надежности упоминается в надстройке Пакет анализа . После вызова надстройки, в диалоговом окне необходимо выбрать инструмент Описательная статистика .

После нажатия кнопки ОК будет выведено другое диалоговое окно.

В этом окне задается Уровень надежности, т.е.значениевероятности в процентах. После нажатия кнопки ОК в выходном интервале выводится значение равное половине ширины доверительного интервала . Этот доверительный интервал используется для оценки среднего значения распределения, когда дисперсия не известна (подробнее см. статью про доверительный интервал ).

Необходимо учитывать, что данный доверительный интервал рассчитывается при условии, что выборка берется из нормального распределения . Но, на практике обычно принимается, что при достаточно большой выборке (n>30), доверительный интервал будет построен приблизительно правильно и для распределения, не являющегося нормальным (если при этом это распределение не будет иметь сильной асимметрии ).

Примечание : Понять, что в диалоговом окне речь идет именно об оценке среднего значения распределения , достаточно сложно. Хотя в английской версии диалогового окна это указано прямо: Confidence Level for Mean .

Если Уровень надежности задан 95%, то надстройка Пакет анализа использует следующую формулу (выводится не сама формула, а лишь ее результат):

или эквивалентную ей

где =СТАНДОТКЛОН.В(Выборка)/КОРЕНЬ(СЧЁТ(Выборка)) – является стандартной ошибкой среднего (формулы приведены в файле примера ).

=ДОВЕРИТ.СТЬЮДЕНТ(1-0,95; СТАНДОТКЛОН.В(Выборка); СЧЁТ(Выборка))

Точность и надежность статистических оценок

Наблюдаемые численности исходов при общепопуляционном формировании выборки

Статистическими оценками разрешающей и предсказательной способностей ПКЛДТ являются соответствующие наблюдаемые частоты.

Статистическое оценивание

Одной из основных задач статистики является статистическое оценивание числовых характеристик (параметров) обследуемой популяции. Цель – по возможности точно и надежно определить (вычислить) значение той или иной числовой характеристики (параметра). Материалом для этого служат имеющиеся статистические данные.

При оценивании параметров на основе варьирующих данных нельзя ограничиваться одним числом. Обязательно нужны еще оценки их варьирования.

Два основных типа статистических оценок

Точечное оценивание – оценка одним числом.

Интервальное оценивание – оценка интервалом.

Для интервального оценивания в статистике используются Доверительные Интервалы. Доверительный интервал — это такой интервал, который содержит (накрывает) оцениваемый параметр с заданной вероятностью. Такая вероятность называется Доверительной Вероятностью или Уровнем Доверия. Уровень Доверия выбирается исследователем.

Основная логика статистического оценивания: точечные оценки

В биомедицинских исследованиях обычно вероятности P (или иные параметры) нам неизвестны. Мы их оцениваем по наблюдаемым численностям.

Например, разумной и интуитивно понятной точечной оценкой для распространенности болезни по данным общепопуляционного (одномоментного поперечно-срезового) исследования может служить наблюдаемая частота

т.е. доля числа больных , выявленных золотым стандартом, от общего числа n обследованных.

Основная логика статистического оценивания: интервальные оценки

Легко представить, что если мы многократно повторим извлечение выборок из данной популяции, то наблюдаемые частоты неизбежно будут варьировать. Поэтому задача математиков – вывести математический закон (вероятностное распределение), которому подчиняется варьирование этой частоты. Если такой закон найден, то тогда можно получить доверительные интервалы (ДИ) для оценки распространенности болезни с заданной доверительной вероятностью .

Доверительные интервалы

Доверительный Интервал (ДИ) есть такой интервал, который с заданной (доверительной) вероятностью накрывает искомое оцениваемое значение параметра. Синонимы: Интервал Доверия или Интервал Накрытия.

Принципиально важно понимать, что ДИ является случайным. Это означает, что от опыта к опыту его границы будут колебаться, варьировать.

Точность и надежность статистических оценок

Чем ýже ДИ, тем оценка точнее. Чем больше доверительная вероятность , тем оценка надежнее. Однако ДИ с доверительной вероятностью 100% — бессмыслен. Например, 100%-й ДИ для доли будет содержать все значения в границах от 0 до 1: [0, 1].

Надежность доверительных интервалов (ДИ)

Уровень значимости в статистике

Уровень значимости в статистике является важным показателем, отражающим степень уверенности в точности, истинности полученных (прогнозируемых) данных. Понятие широко применяется в различных сферах: от проведения социологических исследований, до статистического тестирования научных гипотез.

Определение

Уровень статистической значимости (или статистически значимый результат) показывает, какова вероятность случайного возникновения исследуемых показателей. Общая статистическая значимость явления выражается коэффициентом р-value (p-уровень). В любом эксперименте или наблюдении существует вероятность, что полученные данные возникли из-за ошибок выборки. Особенно это актуально для социологии.

То есть статистически значимой является величина, чья вероятность случайного возникновения крайне мала либо стремится к крайности. Крайностью в этом контексте считают степень отклонения статистики от нуль-гипотезы (гипотезы, которую проверяют на согласованность с полученными выборочными данными). В научной практике уровень значимости выбирается перед сбором данных и, как правило, его коэффициент составляет 0,05 (5 %). Для систем, где крайне важны точные значения, этот показатель может составлять 0,01 (1 %) и менее.

Читать еще:  Контрольно ревизионный отдел функции

История вопроса

Понятие уровня значимости было введено британским статистиком и генетиком Рональдом Фишером в 1925 году, когда он разрабатывал методику проверки статистических гипотез. При анализе какого-либо процесса существует определенная вероятность тех либо иных явлений. Трудности возникают при работе с небольшими (либо не очевидными) процентами вероятностей, подпадающими под понятие «погрешность измерений».

При работе со статистическими данными, недостаточно конкретными, чтобы их проверить, ученые сталкивались с проблемой нулевой гипотезы, которая «мешает» оперировать малыми величинами. Фишер предложил для таких систем определить вероятность событий в 5 % (0,05) в качестве удобного выборочного среза, позволяющего отклонить нуль-гипотезу при расчетах.

Введение фиксированного коэффициента

В 1933 году ученые Ежи Нейман и Эгон Пирсон в своих работах рекомендовали заранее (до сбора данных) устанавливать определенный уровень значимости. Примеры использования этих правил хорошо видны во время проведения выборов. Предположим, есть два кандидата, один из которых очень популярен, а второй – малоизвестен. Очевидно, что первый кандидат выборы выиграет, а шансы второго стремятся к нулю. Стремятся – но не равны: всегда есть вероятность форс-мажорных обстоятельств, сенсационной информации, неожиданных решений, которые могут изменить прогнозируемые результаты выборов.

Нейман и Пирсон согласились, что предложенный Фишером уровень значимости 0,05 (обозначаемый символом α) наиболее удобен. Однако сам Фишер в 1956 году выступил против фиксации этого значения. Он считал, что уровень α должен устанавливаться в соответствии с конкретными обстоятельствами. Например, в физике частиц он составляет 0,01.

Значение p-уровня

Термин р-value впервые использован в работах Браунли в 1960 году. P-уровень (p-значение) является показателем, находящимся в обратной зависимости от истинности результатов. Наивысший коэффициент р-value соответствует наименьшему уровню доверия к произведенной выборке зависимости между переменными.

Данное значение отражает вероятность ошибок, связанных с интерпретацией результатов. Предположим, p-уровень = 0,05 (1/20). Он показывает пятипроцентную вероятность того, что найденная в выборке связь между переменными – всего лишь случайная особенность проведенной выборки. То есть, если эта зависимость отсутствует, то при многократных подобных экспериментах в среднем в каждом двадцатом исследовании можно ожидать такую ​​же либо большую зависимость между переменными. Часто p-уровень рассматривается в качестве «допустимой границы» уровня ошибок.

Кстати, р-value может не отражать реальную зависимость между переменными, а лишь показывает некое среднее значение в пределах допущений. В частности, окончательный анализ данных будет также зависеть от выбранных значений данного коэффициента. При p-уровне = 0,05 будут одни результаты, а при коэффициенте, равном 0,01, другие.

Проверка статистических гипотез

Уровень статистической значимости особенно важен при проверке выдвигаемых гипотез. Например, при расчетах двустороннего теста область отторжения разделяют поровну на обоих концах выборочного распределения (относительно нулевой координаты) и высчитывают истинность полученных данных.

Предположим, при мониторинге некоего процесса (явления) выяснилось, что новая статистическая информация свидетельствует о небольших изменениях относительно предыдущих значений. При этом расхождения в результатах малы, не очевидны, но важны для исследования. Перед специалистом встает дилемма: изменения реально происходят или это ошибки выборки (неточность измерений)?

В этом случае применяют либо отвергают нулевую гипотезу (списывают все на погрешность, или признают изменение системы как свершившийся факт). Процесс решения задачи базируется на соотношении общей статистической значимости (р-value) и уровня значимости (α). Если р-уровень -8 , что не являются редкостью для этой области.

Эффективность

Необходимо учитывать, что коэффициенты α и р-value не являются точными характеристиками. Каким бы ни был уровень значимости в статистике исследуемого явления, он не является безусловным основанием для принятия гипотезы. Например, чем меньше значение α, тем больше шанс, что устанавливаемая гипотеза значима. Однако существует риск ошибиться, что уменьшает статистическую мощность (значимость) исследования.

Исследователи, которые зацикливаются исключительно на статистически значимых результатах, могут получить ошибочные выводы. При этом перепроверить их работу затруднительно, так как ими применяются допущения (коими фактически и являются значения α и р-value). Поэтому рекомендуется всегда, наряду с вычислением статистической значимости, определять другой показатель – величину статистического эффекта. Величина эффекта – это количественная мера силы эффекта.

Источники:

http://studopedia.ru/9_12917_vichislenie-pokazateley-opisatelnoy-statistiki.html
http://helpiks.org/1-107168.html
http://excel2.ru/articles/uroven-znachimosti-i-uroven-nadezhnosti-v-ms-excel
http://lektsii.org/12-55788.html
http://businessman.ru/new-uroven-znachimosti-v-statistike.html

Ссылка на основную публикацию
Статьи c упоминанием слов:

Adblock
detector