Vzorec koeficientu korelace (obsah)
- Vzorec
- Příklady
Co je korelační koeficient?
Ve statistice existují určité výsledky, které mají přímý vztah k jiným situacím nebo proměnným a korelační koeficient je měřítkem tohoto přímého spojení dvou proměnných nebo situací. Tyto proměnné vykazují pozitivní korelační koeficient, když se pohybují ve stejném směru současně. Podobně, pokud se pohybují jiným a opačným směrem, řekli, že mají negativní korelační koeficient. Například: Pokud se úroková sazba na trhu sníží, podnikové půjčky budou levnější a ekonomika vzroste. Úroková sazba a růst ekonomiky tedy mají pozitivní korelační koeficient. Hodnota korelačního koeficientu definuje sílu vztahu mezi proměnnými. Maximální hodnota korelačního koeficientu kolísala od +1 do -1. Pokud je korelační koeficient +1, pak jsou proměnné dokonale pozitivně korelovány a pokud je tato hodnota -1, pak se nazývá dokonale negativně korelovaná.
Předpokládejme, že máme 2 sady dat daných X (X1, X2 … Xn) a Y (Y1, Y2 … Yn).
Vzorec pro korelační koeficient je dán:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Kde:
- X - Datové body v sadě dat X
- Y - Datové body v sadě dat Y
- X m - střední hodnota dat X
- Y m - střední hodnota dat Y
Zdá se, že tento vzorec je časově velmi náročný a matoucí.
Existuje další způsob, jak vypočítat korelační koeficient jednoduše pomocí funkce CORREL () v Excelu. Vysvětlím obě vzorce korelačních koeficientů pomocí příkladů.
Příklady vzorce korelačního koeficientu (se šablonou Excel)
Vezměme si příklad, abychom lépe porozuměli výpočtu koeficientu korelace.
Tuto šablonu korelačního koeficientu vzorce Excel si můžete stáhnout zde - šablonu korelačního koeficientu vzorce ExcelVzorec korelačního koeficientu - příklad č. 1
Řekněme, že máme dvě datové sady X a Y a každá obsahuje 20 náhodných datových bodů. Vypočítejte korelační koeficient pro datový soubor X & Y.
Řešení:
Průměr se počítá jako:
- Průměrná sada dat X = 15, 6
- Průměrná sada dat Y = 13, 8
Nyní musíme vypočítat rozdíl mezi datovými body a střední hodnotou.
Podobně vypočítejte pro všechny hodnoty datové sady X.
Podobně vypočítejte pro všechny hodnoty datové sady Y.
Vypočítejte druhou mocninu rozdílu pro datové sady X a Y.
Vynásobte rozdíl v X pomocí Y.
Koeficient korelace se vypočítá pomocí vzorce uvedeného níže
Korelační koeficient = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
Korelační koeficient = 0, 343264
To znamená, že oba datové soubory mají pozitivní korelaci a jsou dány 0, 343264 .
Vzorec korelačního koeficientu - Příklad č. 2
Řekněme, že chcete investovat peníze na akciovém trhu a chcete investovat do 2 akcií a chcete si tyto akcie vybrat tak, aby vaše portfolio bylo diverzifikováno. To znamená, že pokud vám někdo dá záporný výnos, ostatní vám pomohou získat pozitivní návrat a naopak. Takže v podstatě chcete investovat do akcií, které mají negativní korelaci. Máte 2 zásoby a máte informace o jejich historických výnosech za posledních 15 let.
Řešení:
Korelační koeficient se počítá pomocí excelového vzorce.
Korelační koeficient = -0, 45986
Zde jsme použili funkci CORREL () excel, abychom viděli korelační koeficient pro 2 akcie. Vidíte, že korelační funkce je záporná, což znamená, že obě akcie mají negativní korelaci. Váš výběr je tedy vhodný podle vašich požadavků.
Vysvětlení
Víme a diskutujeme, že korelační koeficient je měřítkem rozsahu vztahu mezi dvěma proměnnými, ale úlovkem je, že může měřit pouze lineární vztah. Tento nástroj není účinný při zachycování nelineárních vztahů. Existuje také několik dalších vlastností korelačního koeficientu:
- Korelační koeficient je nástrojem bez jednotky. Toto je velmi užitečná vlastnost, protože umožňuje porovnávat data, která mají různé jednotky. Například, ceny akcií jsou závislé na různých parametrech, jako je inflace, úrokové sazby atd. Takže můžeme pomocí veřejných informací určit jejich vzájemnou korelaci.
- Jak bylo uvedeno výše, její hodnota leží mezi + 1 až -1. Takže +1 je dokonale pozitivně korelována a -1 je dokonale negativně korelována.
Relevance a použití koeficientu korelace
Korelační koeficient nám pomáhá lépe porozumět datovým souborům a jejich vztahům a má mnoho aplikací v oblasti financí a ekonomiky. Finanční instituce, banky, společnosti a dokonce i vlády využívají korelační koeficient, aby sledovaly historické údaje a extrahovaly smysluplné informace a efektivně předpovídaly trendy na trhu. Korelační koeficient je velmi výkonný nástroj, ale neměl by být používán v sila a aplikovat spolu s jinými nástroji. Důvod je jednoduchý, nemůžeme se jednoduše spolehnout na data a data nám někdy poskytují naprosté úplné informace. Například: Pokud jste shromáždili informace a musíte vědět, že existuje pozitivní korelace mezi deštěm a smrtí psů. To znamená, že v roce, kdy byl déšť, bylo mnoho psů, kteří zemřeli. I když existuje korelace, která vůbec nemá smysl. Tomu se říká falešná korelace. Buďte tedy velmi opatrní při rozhodování pouze na základě údajů.
Doporučené články
Toto byl průvodce formulací koeficientu korelace. Zde diskutujeme, jak vypočítat korelační koeficient pomocí vzorce spolu s praktickými příklady a stahovatelnou šablonou Excel. Další informace naleznete také v následujících článcích -
- Průvodce koeficientem stanovení vzorce
- Vzorec pro výpočet upraveného R na druhou
- Jak vypočítat kosovství pomocí vzorce?
- Příklady korelačního vzorce s šablonou Excel