Standardní odchylka a standardní chyba

Anonim

Úvod

Standard D vyhnání (SD) a S tandard E rror (SE) jsou zdánlivě podobné terminologie; nicméně jsou koncepčně tak rozmanité, že jsou ve Statistické literatuře téměř zaměnitelné. Oba pojmy obvykle předchází symbol plus + minus (+/-), což naznačuje, že definují symetrickou hodnotu nebo reprezentují rozsah hodnot. Neustále se objevují oba termíny s průměrným (průměrným) souborem naměřených hodnot.

Zajímavé je, že SE nemá nic společného s normami, chybami nebo se sdělením vědeckých údajů.

Podrobný pohled na původ a vysvětlení SD a SE odhalí, proč odborní statistici a ti, kteří je používají v kurzu, oba mají tendenci chybět.

Standardní odchylka (SD)

SD je a popisný statistické popisující šíření distribuce. Jako metrika je užitečné, když jsou data normálně distribuována. Nicméně je méně užitečné, když jsou data vysoce šikmá nebo bimodální, protože velmi dobře popisuje tvar distribuce. Typicky používáme SD při oznamování vlastností vzorku, protože zamýšlíme popsat kolik se data liší v průměru. Dalšími užitečnými statistikami pro popis šíření dat jsou mezikvartilní rozsah, 25. a 75. percentil a rozsah dat.

Obrázek 1. SD je měřítkem šíření dat. Pokud jsou data vzorky z normálně distribuované distribuce, předpokládá se, že dvě třetiny dat leží uvnitř jedné standardní odchylky od průměru.

Variance je a popisný statistické a je definováno jako čtverec standardní odchylky. Obvykle se při popisu výsledků nezveřejňuje, ale je to více matematicky traktovatelný vzorec (a.k.a. součet čtvercových odchylek) a hraje roli při výpočtu statistik.

Například pokud máme dvě statistiky P & Q se známými odchylkami var (P) & var (Q) , pak rozptyl součtu P + Q se rovná součtu odchylek: var (P) + var (Q) . Nyní je zřejmé, proč se statistici rádi mluví o odchylkách.

Standardní odchylky však mají význam pro šíření, zvláště když jsou data normálně distribuována: Interval +/- 1 SD lze očekávat zachycení 2/3 vzorku a průměrného intervalu + - 2 SD lze zachytit 95% vzorku.

SD udává, do jaké míry se jednotlivé odpovědi na otázku liší nebo se "odchylují" od průměru. SD řekne výzkumnému pracovníkovi, jak jsou odpovědi rozptýleny - jsou soustředěny kolem středu nebo jsou rozptýleny dál a široce? Vyhodnotili všichni vaši respondenti váš produkt uprostřed vašeho měřítka, nebo někteří ho schválili a někteří ho nesouhlasili?

Zvažte experiment, kdy se respondenti vyzývají k hodnocení produktu na sérii atributů v pětibodové škále. Průměr pro skupinu deseti respondentů (označená jako "A" až "J" níže) za "dobrou hodnotu za peníze" byla 3,2 s SD 0,4 a průměr pro "spolehlivost produktu" byl 3,4 s SD 2,1.

Na první pohled (při pohledu na prostředky pouze) se zdá, že spolehlivost byla hodnocena vyšší než hodnota. Ale vyšší spolehlivost SD může naznačovat (jak je patrné z níže uvedené distribuce), že odpovědi byly velmi polarizované, kde většina respondentů neměla problémy se spolehlivostí (hodnotila atribut "5"), ale menší, ale důležitý segment respondentů měl problém spolehlivosti a ohodnotil atribut "1". Podíváme-li se na samotné znamení, vypráví jen část příběhu, nicméně častěji než to, to se vědci zaměřují. Rozdělení odpovědí je důležité zvážit a SD je cenným popisným opatřením.

Odpůrce Dobrá hodnota za peníze Spolehlivost produktu
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
I 3 5
J 3 5
Znamenat 3.2 3.4
Std. Dev. 0.4 2.1

První průzkum: Respondenti hodnotí produkt v pětibodové škále

Dvě velmi rozdílná rozdělení odpovědí na pětibodovou klasifikační stupnici mohou poskytnout stejný průměr. Zvažte následující příklad ukazující hodnoty odezvy pro dvě různé hodnocení.

V prvním příkladu (hodnocení "A") je hodnota SD nula, protože všechny odpovědi byly přesně střední hodnotou. Jednotlivé reakce se vůbec neodchylují od prostředku.

Při hodnocení "B", i když je průměrná skupina stejná (3,0) jako první distribuce, je standardní odchylka vyšší. Standardní odchylka 1,15 ukazuje, že jednotlivé odezvy, v průměru *, byly o něco více než 1 bod od průměru.

Odpůrce Hodnocení "A" Hodnocení "B"
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
I 3 4
J 3 5
Znamenat 3.0 3.0
Std. Dev. 0.00 1.15

Druhý průzkum: Respondenti hodnotí produkt v pětibodové škále

Dalším způsobem, jak hledat na SD, je vykreslení distribuce jako histogramu odpovědí. Distribuce s nízkou hodnotou SD by se zobrazovala jako vysoký úzký tvar, zatímco velká SD by byla označena širším tvarem.

SD obecně nenaznačuje "správné nebo špatné" nebo "lepší nebo horší" - nižší SD není nutně žádoucí. Používá se pouze jako popisná statistika. Popisuje distribuci ve vztahu k průměru.

T echnical disclaimer týkající se SD

Přemýšlet o SD jako o "odchylce" je vynikajícím způsobem konceptuálního pochopení jejího významu. Nicméně, to není ve skutečnosti vypočítáno jako průměr (pokud by to bylo, říkali bychom to, "odchylka"). Namísto toho je "standardní", poněkud složitá metoda výpočtu hodnoty pomocí součtu čtverců.

Pro praktické účely není výpočet důležitý. Většina tabulačních programů, tabulek nebo jiných nástrojů pro správu dat vypočítá SD pro vás. Důležité je pochopit, co předávají statistiky.

Standardní chyba

Standardní chyba je inferenční statistické údaje, které se používají při porovnávání průměrů vzorků (průměrů) mezi populacemi. Je to míra přesnost průměru vzorku. Průměrný vzorek je statistika odvozená od dat, která má základní rozdělení. Můžeme ji vizualizovat stejně jako údaje, protože jsme provedli jediný experiment a měli pouze jednu hodnotu. Statistická teorie nám říká, že střední hodnota vzorku (pro velký, celkový vzorek a za několika pravidelných podmínek) je přibližně normálně distribuována. Standardní odchylka této normální distribuce je to, co nazýváme standardní chybou.

Obrázek 2. Distribuce ve spodní části rozděluje data, zatímco distribuce nahoře je teoretické rozložení vzorku. Hodnota SD 20 je měřítkem šíření dat, zatímco hodnota SE 5 je měřítkem nejistoty kolem průměru vzorku.

Když chceme porovnat způsoby výsledků dvou experimentů léčby A vs. léčby B, pak musíme odhadnout, jak přesně jsme tyto prostředky změřili.

Ve skutečnosti nás zajímá, jak přesně jsme změřili rozdíl mezi těmito dvěma způsoby. Toto opatření nazýváme standardní chybou rozdílu. Nemusíte být překvapeni, když zjistíte, že standardní chyba rozdílu ve vzorku znamená funkci standardních chyb prostředků:

Nyní, když jste pochopili, že standardní chyba střední hodnoty (SE) a standardní odchylky distribuce (SD) jsou dvě různá zvířata, možná se divíte, jak se na první místo zmátli. Zatímco se liší koncepčně, mají matematický jednoduchý vztah:

, kde n je počet datových bodů.

Všimněte si, že standardní chyba závisí na dvou složkách: standardní odchylka vzorku a velikost vzorku n . To dělá intuitivní smysl: čím větší je standardní odchylka vzorku, tím méně přesně můžeme být o našem odhadu skutečného průměru.

Také velká velikost vzorku, tím více informací o populaci a přesněji odhadujeme skutečný průměr.

SE je indikátorem spolehlivosti průměru. Malá SE je známkou toho, že střední hodnota vzorku je přesnějším odrazem skutečného průměrného počtu obyvatel. Větší velikost vzorku obvykle vede k menší SE (zatímco SD není přímo ovlivněna velikostí vzorku).

Většina průzkumů zahrnuje výběr vzorku od populace. Následně pojednáváme o populaci z výsledků získaných z tohoto vzorku. Pokud byl nakreslen druhý vzorek, výsledky pravděpodobně nebudou přesně odpovídat prvnímu vzorku. Pokud by průměrná hodnota pro atribut ratingu byla pro jeden vzorek 3,2, mohlo by to být 3,4 u druhého vzorku stejné velikosti. Pokud bychom z naší populace nakreslila nekonečný počet vzorků (stejné velikosti), mohli bychom pozorovat pozorované prostředky jako distribuci. Potom bychom mohli vypočítat průměr všech našich vzorkových prostředků. Tento průměr by se rovnal skutečnému průměru obyvatelstva. Můžeme také vypočítat SD rozložení vzorkovacích prostředků. SD této distribuce vzorkového prostředku je SE každého jednotlivého průměru vzorku.

Máme tedy naše nejvýznamnější pozorování: SE je SD populačního průměru.

Vzorek Znamenat
První 3.2
2. místo 3.4
3. místo 3.3
4. 3.2
5. místo 3.1
…. ….
…. ….
…. ….
…. ….
…. ….
Znamenat 3.3
Std. Dev. 0.13

Tabulka znázorňující vztah mezi SD a SE

Nyní je jasné, že pokud SD této distribuce nám pomůže pochopit, jak daleko je vzorek znamenat ze skutečné populace, pak to můžeme využít k pochopení, jak přesný je každý jednotlivý vzorek ve vztahu k pravému průměru. To je podstatou SE.

Ve skutečnosti jsme z naší populace nakreslili pouze jeden vzorek, ale můžeme tento výsledek použít k tomu, abychom poskytli odhad spolehlivosti našeho pozorovaného vzorku.

Ve skutečnosti nám SE říká, že můžeme mít 95% jistotu, že náš pozorovaný vzorek znamená plus nebo mínus zhruba 2 (ve skutečnosti 1,96) standardních chyb z populačního průměru.

Níže uvedená tabulka zobrazuje rozložení odpovědí z naší první (a pouze) vzorku použité pro náš výzkum. Hodnota SE 0,13, která je poměrně malá, nám dává známku toho, že náš průměr je relativně blízký skutečnému průměru naší celkové populace. Hranice chyby (u 95% spolehlivosti) pro naše průměrné hodnoty je (zhruba) dvakrát vyšší než hodnota (+/- 0,26), což nám říká, že skutečný průměr je pravděpodobně mezi 2,94 a 3,46.

Odpůrce Hodnocení
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
I 3
J 3
Znamenat 3.2
Std. Chybovat 0.13

souhrn

Mnoho vědců nerozumí rozdílu mezi standardní odchylkou a standardní chybou, přestože jsou běžně zahrnuty do analýzy dat. Zatímco skutečné výpočty standardní odchylky a standardní chyby vypadají velmi podobně, představují dvě velmi odlišná, ale doplňková opatření. SD nám popisuje tvar naší distribuce, jak blízké hodnoty jednotlivých dat jsou od střední hodnoty. SE nám říká, jak blízko náš vzorek znamená skutečný průměr celé populace.Společně pomáhají poskytnout úplnější obraz, než nám to samo o sobě může říct.