Интервал поверења

Шта је интервал поверења:

То је процјена распона који се користи у статистици, који садржи параметар популације. Овај непознат популациони параметар се налази кроз модел узорка израчунат из прикупљених података .

Пример: просек прикупљеног узорка к може или не мора одговарати правој средњој популацији μ. За ово је могуће размотрити низ узорака који могу да садрже ову популацију. Што је дужи тај интервал, већа је вјероватноћа да ће се то догодити.

Интервал поузданости је изражен као проценат, изражен нивоом поузданости, са највише показатеља од 90%, 95% и 99%. На слици испод, на пример, имамо интервал поверења од 90% између његових горњих и доњих граница (а и -а ).

Пример интервала поверења од 90% између његових горњих (а) и нижих (-а) граница.

Интервал поверења је један од најважнијих концепата у тестирању хипотеза у статистици, јер се користи као мера неизвесности. Појам је увео пољски математичар и статистичар Јерзи Неиман 1937. године.

Који је значај интервала поверења?

Интервал поузданости је важан за означавање границе несигурности (или непрецизности) у односу на израчунавање. Ова калкулација користи узорак студије за процену стварне величине резултата у изворној популацији.

Израчунавање интервала поузданости је стратегија која узима у обзир узорковање грешака. Величина исхода ваше студије и интервал поузданости карактеришу претпостављене вредности за оригиналну популацију.

Што је ужи интервал поузданости, већа је вероватноћа да проценат испитиване популације представља стварни број популације извора, дајући већу сигурност у погледу исхода студијског објекта.

Како интерпретирати интервал поверења?

Тачно тумачење интервала поузданости је вероватно најизазовнији аспект овог статистичког концепта. Пример најчешћег тумачења концепта је следећи:

Постоји вјероватноћа од 95% да ће у будућности права вриједност параметра становништва (нпр. Просјек) пасти у распону Кс (доња граница) и И (горња граница).

Стога се интервал поузданости интерпретира на следећи начин: 95% је увјерено да интервал између Кс (доња граница) и И (горња граница) садржи праву вриједност параметра популације.

Било би потпуно погрешно тврдити да: постоји 95% вјероватноћа да интервал између Кс (доња граница) и И (горња граница) садржи стварну вриједност параметра популације.

Горња изјава је најчешћа заблуда о интервалу поузданости. Након израчунавања статистичког распона, он може садржати само параметар популације или не.

Међутим, интервали могу варирати између узорака, док је стварни параметар популације исти без обзира на узорак.

Према томе, изјава поузданости интервала поузданости може се дати само у случају када се интервали поузданости поново израчунавају за број узорака.

Кораци израчунавања интервала поверења

Опсег се израчунава помоћу следећих корака:

  • Прикупите податке узорка: н ;
  • Израчунајте средњу вредност узорка к;
  • Утврдити да ли је стандардна девијација популације ( σ ) позната или непозната;
  • Ако је позната стандардна девијација популације, з-точка се може користити за одговарајући ниво поузданости;
  • Ако је стандардна девијација популације непозната, можемо користити статистику т за одговарајући ниво поузданости;
  • Према томе, доња и горња граница интервала поузданости се налазе помоћу следећих формула:

а) Стандардна девијација познате популације :

Формула за израчунавање стандардне девијације познате популације.

б) Стандардна девијација непознате популације :

Формула за израчунавање стандардне девијације непознате популације.

Практични пример интервала поузданости

Клиничка студија је проценила повезаност између присуства астме и ризика од развоја опструктивне апнеје у спавању код одраслих.

Неки одрасли су насумично регрутовани са списка државних службеника који ће се пратити четири године.

Учесници са астмом, у поређењу са онима без, имали су већи ризик од развоја апнеје током четири године.

У спровођењу клиничких истраживања као што је овај пример, подскуп популације од интереса се обично регрутује да би се повећала ефикасност студија (мање трошкова и мање времена).

Ова подгрупа појединаца, проучена популација, састоји се од оних који испуњавају критеријуме укључивања и пристају да учествују у студији, као што је приказано на слици испод.

Експланаторна графика популације проучене у овом примјеру.

Затим, студија је завршена и величина ефекта (на пример, средња разлика или релативни ризик ) се израчунава да би се одговорило на истраживачко питање.

Овај процес, назван закључак, подразумева употребу података прикупљених од испитиване популације да би се проценила величина стварног утицаја на популацију од интереса, односно популацију порекла.

У датом примјеру, истраживачи су запослили случајни узорак државних службеника (изворне популације) који су били прихватљиви и пристали да учествују у студији (испитивана популација) и пријавили да астма повећава ризик од развоја апнеје у испитаној популацији.

Да би се узела у обзир грешка у узорковању услед регрутовања само подгрупе популације од интереса, они су такође израчунали 95% интервал поузданости (око процене) од 1.06 - 1.82, што указује на вероватноћу 95 % да је стварни релативни ризик у изворној популацији између 1.06 и 1.82 .

Интервал поверења за просек

Када се добије информација о стандардној девијацији популације, може се израчунати интервал поузданости за просек или просек те популације.

Када је статистичка карактеристика која се мери (као што су приход, ИК, цена, висина, количина или тежина) нумеричка, у већини случајева се процењује да је просечна вредност за популацију пронађена.

Дакле, покушавамо да пронађемо средњу вредност популације ( μ ) користећи средњу вредност узорка ( к ), са маргином грешке. Резултат ове калкулације се назива интервал поузданости за средњу популацију .

Када је позната стандардна девијација популације, формула за интервал поузданости (ЦИ) за средњу популацију је:

Где:

  • к је средња вредност узорка;
  • σ је стандардна девијација популације;
  • н је величина узорка;
  • Репресентс * представља одговарајућу вредност стандардне нормалне дистрибуције за жељени ниво поузданости.

Слиједе вриједности за различите разине поузданости ( ) * ):

Ниво поверењаВредност З * -
80%1.28
90%1.645 (конвенционално)
95%1.96
98%2.33
99%2.58

У горњој табели приказане су вриједности з * за понуђене нивое поузданости. Напомињемо да се ове вредности добијају из стандардне нормалне дистрибуције (З-).

Подручје између сваке з * вриједности и негатив ове вриједности је (приближни) постотак повјерења. На пример, површина између з * = 1.28 и з = -1.28 је приближно 0.80. Стога, ова табела се може проширити и на друге проценте поузданости. Табела приказује само најчешће коришћене проценте поверења.

Види и значење хипотезе.