Kovariance a korelace

Anonim

Covariance vs. korelace

Covariance a korelace jsou dva pojmy v oblasti pravděpodobnosti a statistiky. Obě koncepty popisují vztah mezi dvěma proměnnými. Dále jsou oba nástroji měření určitého druhu závislosti mezi proměnnými.

"Covariance" je definována jako "očekávaná hodnota variací dvou náhodných variant od jejich očekávaných hodnot", zatímco "korelace" je "očekávaná hodnota dvou náhodných variant". Pro zjednodušení se snaží provést kovarianci a zjistit, kolik proměnných se mění společně. V tomto konceptu se oba proměnné mohou měnit stejným způsobem bez uvedení jakéhokoli vztahu. Covariance je měření síly nebo slabosti korelace mezi dvěma nebo více množinami náhodných proměnných, zatímco korelace slouží jako měřítka verze kovariance.

Jak kovariance, tak korelace mají odlišné typy. Covariance lze klasifikovat jako pozitivní kovarianci (dvě proměnné se mění společně) a negativní kovarianci (jedna proměnná je nad nebo pod očekávanou hodnotou ve srovnání s jinou proměnnou). Na druhou stranu, korelace má tři kategorie: pozitivní, negativní nebo nula. Pozitivní korelace je označena znaménkem plus, negativní korelací záporným znaménkem a nekorelovanými proměnnými - o "0."

Oba covariance a korelace mají rozmezí. Hodnoty korelace jsou v měřítku od -1 do +1. Pokud jde o kovarianci, hodnoty mohou překročit nebo mohou být mimo rozsah korelace. Kromě toho jsou korelační hodnoty závislé na měrných jednotkách "X" a "Y." Dalším pozoruhodným rozdílem je, že korelace není dimenzionální. Naproti tomu je kovarianta popsána v jednotkách tvořených vynásobením jednotky jedné proměnné jinou jednotkou jiné proměnné. Covariance se zaměřuje na vztah mezi dvěma entitami, jako jsou proměnné nebo soubory dat. Naproti tomu korelace může zahrnovat dvě nebo více proměnných nebo datových sad a vztahy mezi nimi.

Dalším významným rozdílem mezi těmito dvěma je, že kovariance je často v tandemu s rozptylem (jedním ze svých vlastností, ale také společným měřítkem rozptýlení nebo rozptylu), zatímco korelace jde společně se závislostí a regresní analýzou. "Závislost" je definována jako "jakýkoli vztah mezi dvěma datovými sadami nebo náhodnými proměnnými", zatímco regresní analýza je metoda použitá k prozkoumání vztahu mezi nezávislými a závislými proměnnými. Jiné klasifikace korelace jsou částečné a vícenásobné korelace.

Souhrn:

1.Kovariance a korelace jsou dva pojmy ve studiu statistik a pravděpodobnosti. Jsou odlišné ve svých definicích, ale úzce souvisejí. Obě koncepty popisují vztah a měří druh závislosti mezi dvěma nebo více proměnnými. 2.Covariance je očekávaná hodnota rozdílu mezi dvěma náhodnými variantami od jejich očekávaných hodnot, zatímco korelace má téměř stejnou definici, ale nezahrnuje variace. 3.Covariance je také měřítko dvou náhodných proměnných, které se liší společně. Mezitím je korelace spojena se vzájemnou závislostí nebo asociací. Jednoduše řečeno, korelace je, jak daleko nebo jak blízké jsou dvě proměnné od toho, že jsou navzájem nezávislé. 4.Covariance je měřítkem korelace, zatímco korelace je měřítkem verze kovariance. 5.Covariance může zahrnovat vztah mezi dvěma proměnnými nebo datovými sadami, zatímco korelace může zahrnovat vztah mezi více proměnnými také. 6. Hodnoty korelace jsou v rozmezí od kladné 1 do záporné hodnoty 1. Na druhou stranu hodnoty kovariance mohou překročit tuto měřítko. 7. Korelace a kovariance používají pozitivní nebo negativní popis jejich typů. Covariance má dva typy - pozitivní kovarianci (kde dvě proměnné se liší společně) a negativní kovarianci (kde jedna proměnná je vyšší nebo nižší než druhá). Pokud jde o korelaci, pozitivní a negativní korelace jsou spojeny další kategorií, "0" - nekoresponovaný typ.