Parametrické a neparametrické

Anonim

Sociální vědci často vytvářejí hypotézu, ve které předpokládají, že určité obecné pravidlo může být aplikováno na obyvatele. Testují tuto hypotézu pomocí testů, které mohou být buď parametrické nebo neparametrické. Parametrické testy jsou obvykle častější a studovány mnohem dříve jako standardní testy použité při provádění výzkumu.

Proces provádění výzkumu je poměrně jednoduchý - stavíte hypotézu a předpokládáte, že určitý "zákon" může být aplikován na obyvatele. Poté provedete test a shromažďujete údaje, které poté analyzujete statisticky. Shromážděné údaje mohou být obvykle reprezentovány jako graf a hypotéza jako střední hodnota těchto dat. Pokud hypotetický zákon a střední hodnota zákona odpovídají, hypotéza je potvrzena.

Avšak v některých případech není nalezení průměrné hodnoty nejvhodnějším způsobem, jak vyhledávat zákon. Velkým příkladem je rozdělení celkových příjmů. Pokud jste nedosáhli průměrné hodnoty, je to pravděpodobně proto, že jeden nebo dva miliardáři znepokojují vaše střední hodnoty. Avšak medián poskytne mnohem přesnější výsledek o průměrném příjmu, který pravděpodobněji odpovídá vašim datům.

Jinými slovy, parametrický test se použije, pokud jsou předpoklady týkající se populace jasné a existuje mnoho dostupných informací o něm. Otázky budou navrženy tak, aby měřily tyto specifické parametry, aby mohly být údaje analyzovány tak, jak je popsáno výše. Neparametrický test se používá, když testovaná populace není zcela známa, a proto jsou také vyšetřované parametry neznámé. Dále, zatímco parametrický test používá jako výsledek střední hodnoty, neparametrický test trvá medián, a proto je obvykle používán, když původní hypotéza nesouhlasí s daty.

Co je parametrický test?

Parametrický test je test určený k poskytnutí údajů, které budou následně analyzovány prostřednictvím oboru vědy nazvané parametrické statistiky. Parametrická statistika předpokládá, že jsou známy některé informace o populaci, a sice rozdělení pravděpodobnosti. Například distribuce výšky těla na celém světě je popsána normálním distribučním modelem. Stejně tak může být na soubor dat aplikován jakýkoli známý distribuční model. Nicméně, za předpokladu, že určitý distribuční model zapadá do datasetu, znamená to, že ve své podstatě předpokládáte, že o populaci jsou známy některé další informace, jak jsem již zmínil. Distribuce pravděpodobnosti obsahuje různé parametry, které popisují přesný tvar distribuce. Tyto parametry poskytují parametrické testy - každá otázka je přizpůsobena tak, aby poskytovala přesnou hodnotu určitého parametru pro každého jednotlivého dotazovaného. V kombinaci se průměrná hodnota tohoto parametru použije pro rozdělení pravděpodobnosti. To znamená, že parametrické testy také předpokládají něco o populaci. Pokud jsou předpoklady správné, parametrická statistika aplikovaná na údaje poskytnuté parametrickým testem poskytne výsledky, které jsou mnohem přesnější a přesnější než výsledky neparametrického testu a statistiky.

Co je neparametrický test?

Stejně jako parametrický test a statistika existují neparametrické testy a statistiky. Používají se, pokud se neočekává, že získaná data odpovídají normální distribuční křivce nebo řadovým údajům. Skvělý příklad řadových dat je kontrola, kterou odešlete, když ohodnotíte určitý produkt nebo službu na stupnici od 1 do 5. Pořadové údaje obecně se získají z testů, které používají různé pořadí nebo objednávky. Proto se nespoléhá na čísla nebo přesné hodnoty pro parametry, na které se spoléhají parametrické testy. Ve skutečnosti nevyužívá parametry žádným způsobem, protože nepředpokládá určitou distribuci. Obvykle je preferována parametrická analýza než neparametrická, ale pokud parametrický test nelze provést kvůli neznámé populaci, je nutné použít neparametrické testy.

Rozdíl mezi parametrickými a neparametrickými testy

1) Předpoklady

Jak jsem již zmínil, parametrický test vytváří předpoklady o populaci. Potřebuje parametry, které jsou spojeny s normálním rozdělením, které se používá při analýze a jediným způsobem, jak tyto parametry znát, je mít určité znalosti o populaci. Na druhé straně neparametrická zkouška, jak naznačuje název, se nespoléhá na žádné parametry, a proto nepředpokládá nic o populaci.

2) Pravděpodobnost parametrických a neparametrických

Základem pro statistickou analýzu, která bude provedena na datech, v případě parametrických testů, je pravděpodobnostní rozdělení. Na druhou stranu neexistuje základ pro neparametrické testy - je to zcela libovolné. Výsledkem je větší flexibilita a snazší přizpůsobení hypotézy se shromážděnými daty.

3) Měření centrální tendence

Měření centrální tendence je centrální hodnotou v rozdělení pravděpodobnosti. A ačkoliv rozdělení pravděpodobnosti v případě neparametrické statistiky je libovolné, stále existuje, a proto se jedná o měřítko centrální tendence. Tato opatření jsou však odlišná.V případě parametrických zkoušek se považuje za střední hodnotu, zatímco u neparametrických zkoušek se považuje za střední hodnotu.

4) Znalost parametrů populace

Jak jsem zmínil v prvním rozdílu, informace o populaci se liší mezi parametrickými a neparametrickými testy a statistikami. Určité znalosti o populaci jsou naprosto nezbytné pro parametrickou analýzu, protože vyžaduje parametry související s obyvatelstvem, aby bylo dosaženo přesných výsledků. Na druhou stranu lze provést neparametrický přístup bez předchozího vědomí populace.

Parametrické vs. neparametrické testy: Tabulka srovnání

Shrnutí parametrických a neparametrických

  • Parametrický test je test, který předpokládá, že určité parametry a rozdělení jsou známy o populaci, na rozdíl od neparametrické
  • Parametrický test používá střední hodnotu, zatímco neparametrický používá střední hodnotu
  • Parametrický přístup vyžaduje předchozí znalosti o populaci v rozporu s neparametrickým přístupem