Skupinová data a znehodnocená data

Anonim

Slovní data se vztahují k informacím, které jsou shromažďovány a zaznamenávány. Může být ve formě čísel, slov, měření a mnohem více.

Existují dva typy dat, a to jsou kvalitativní údaje a kvantitativní údaje. Rozdíl mezi těmito dvěma typy dat spočívá v tom, že k popisu číselných údajů se používá kvantitativní údaje. Například měření teploty by spadalo pod tento druh dat.

Na druhé straně se kvalitativní údaje používají k popisu informací slovem. Po shromažďování dat je nutno organizovat proto nutnost oddělit seskupená data od nesourodých dat. Oba jsou užitečné formy dat, ale rozdíl mezi nimi spočívá v tom, že nesoustředěná data jsou nespracovaná data. To znamená, že se právě shromáždil, ale nebyl zařazen do žádné skupiny nebo tříd. Na druhé straně seskupené údaje jsou data, která byla zorganizována do skupin z nespracovaných dat.

Co jsou to seskupená data?

Jak bylo uvedeno výše, seskupené údaje jsou typ dat, který je po sběru zařazen do skupin. Nezpracované údaje jsou roztříděny do různých skupin a vytvoří se tabulka. Primárním účelem tabulky je ukázat datové body, které se vyskytují v každé skupině. Například při provedení testu jsou výsledky v tomto scénáři a existuje mnoho způsobů, jak tyto údaje seskupit. Například může být zaznamenán počet studentů, kteří zaznamenali více než 20 bodů.

Alternativně mohou být známky použity. Například, 90-100 až do F 0-59 s každou kategorií ukazuje kolik studentů v každé kategorii. Histogramy a frekvenční tabulky se nejlépe používají k zobrazení a interpretaci seskupených dat. Zde je příklad

Seskupování dat má následující výhody:

  • Pomáhá zvyšovat efektivitu odhadů.
  • Umožňuje větší vyvážení statistické síly testů rozdílu mezi vrstvami analýzou stejného čísla od vrstev.
  • Nepodstatná subpopulace jsou ignorována, zatímco významné jsou zaměřeny.

Co je to zachycená data?

Zrušené údaje, které jsou také známé jako nezpracované údaje, jsou data, která nebyla po sběru zařazena do žádné skupiny nebo kategorie. Data jsou roztříděna do čísel nebo charakteristik, takže data, která nebyla zařazena do žádné z kategorií, nejsou rozdělena. Například při provádění sčítání lidu a chcete analyzovat, kolik žen ve věku nad 45 let je v určité oblasti, musíte nejprve vědět, kolik lidí v této oblasti bydlí.

Počet osob s bydlištěm v této oblasti je nesoustředěná data nebo surové informace, protože nic nebylo kategorizováno. Proto můžeme usuzovat, že nesourodé údaje jsou údaje používané k zobrazení informací o jednotlivém členu vzorku nebo populace.

Některé z výhod nesourodých dat jsou následující:

  • Většina lidí ji může snadno interpretovat.
  • Pokud je velikost vzorku malá, lze snadno vypočítat průměr, režim a medián.
  • To nevyžaduje odborné znalosti k jeho analýze.

Rozdíly mezi seskupenými daty a zneužitými daty

  • Klasifikace seskupených dat vs. vyřazených dat

Skupinová data jsou data, která byla po analýze uspořádána do tříd. Příklady zahrnují, kolik sáčků z kukuřice shromážděných během období dešťů bylo špatné. Na druhou stranu jsou nesoustředěná data data, která nespadají do žádné skupiny. Je to stále surovina.

  • Upřednostnění seskupených dat vs. vyřazených dat

Při shromažďování dat jsou preferovány nesourodé údaje, protože informace jsou stále v původní podobě. To nebylo ovlivněno klasifikací nebo dělením. Při analýze a kreslení grafů je však preferována seskupená data, protože je snadná k interpretaci.

  • Přesnost seskupených dat vs. vyřazených dat

Při výpočtu prostředků seskupených a nesoustředěných dat se bude jednat o variaci. Průměrná seskupení dat je upřednostňována, protože je přesnější ve srovnání se střední hodnotou nesoustředěných dat. Střední hodnota nesourodých dat může vést k nesprávné manipulaci s mediánem, proto je ve většině případů považována za neúčinnou.

  • Zastoupení seskupených dat versus seskupených dat

Frekvenční tabulky se používají k zobrazení informací o seskupených datech, zatímco v případě nesoustředěných dat se informace zobrazují jako velký seznam čísel. To je způsobeno skutečností, že informace jsou stále suroviny.

  • souhrn

Skupinová data jsou data, která byla uspořádána do distribuce frekvencí, zatímco nesoustředěná data nebyla v žádném případě shrnuta.

Skupinová data se seskupenými daty

Shrnutí seskupených datových verzí Zrušené údaje

  • Ve statistice se termínová data používá k odkazu na informace, které byly shromážděny a zaznamenány pro účely konkrétních projektů, a to může být buď kvalitativní nebo kvantitativní.
  • Jak seskupená, tak i nerozdělená data jsou typy dat, ale seskupená data byla klasifikována do kategorií založených na podobných charakteristikách, zatímco nesoustředěná data jsou nespolehlivými daty.
  • Oba typy dat mohou být reprezentovány frekvenčními tabulkami. U seskupených dat však neexistují limity třídy, a proto se používají značky shody. Skupinová data v tabulce frekvencí mají limity a to je limit horní třídy a nižší limit třídy.
  • Oba typy dat mohou být použity k výpočtu střední, módy a mediánu vzorků populace, proto jsou užitečné.