Koeficient stanovení vzorce Výpočet pomocí šablony Excel

Obsah:

Anonim

Koeficient determinace (obsah)

  • Vzorec
  • Příklady

Co je to koeficient stanovení?

Ve statistice je koeficient stanovení, označovaný také jako R2, nástrojem, který určuje a hodnotí schopnost statistického modelu vysvětlit a předpovídat budoucí výsledky. Jinými slovy, pokud máme v modelu závislou proměnnou y a nezávislou proměnnou x, potom R2 pomáhá při určování variace v y variací x. Je to jeden z klíčových výstupů regresní analýzy a používá se, když chceme předpovídat budoucnost nebo testovat některé modely se souvisejícími informacemi. Hodnota R2 leží mezi 0 a 1 a čím vyšší je hodnota R2, tím lepší bude predikce a síla modelu. R2 je velmi podobný korelačnímu koeficientu, protože korelační koeficient měří přímé spojení dvou proměnných. R2 je v podstatě čtverec korelačního koeficientu.

Vzorec pro koeficient určení:

Pro výpočet koeficientu stanovení existuje více vzorců:

  1. Použití korelačního koeficientu:

Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )

Kde:

  • X - Datové body v sadě dat X
  • Y - Datové body v sadě dat Y
  • X m - střední hodnota dat X
  • Y m - střední hodnota dat Y

Tak

Coefficient of Determination(R 2 ) = (Correlation Coefficient) 2

  1. Použití výstupů regrese

Koeficient determinace (R2) = Vysvětlená variace / celková variace

Koeficient stanovení (R2) = MSS / TSS

Coefficient of Determination (R 2 ) = (TSS – RSS) / TSS

Kde:

  • TSS - celkový součet čtverců = Σ (Yi - Ym) 2
  • MSS - modelový součet čtverců = Σ (Y - Ym) 2
  • RSS - Zbytkový součet čtverců = Σ (Yi - Y ^) 2

Y je předpovězená hodnota modelu, Yi je ith hodnota a Ym je střední hodnota

Příklady vzorce stanovení koeficientu (s šablonou Excel)

Vezměme si příklad, abychom lépe porozuměli výpočtu koeficientu determinace.

Tuto šablonu koeficientu determinace vzorce Excel si můžete stáhnout zde - šablonu koeficientu determinace vzorce Excel

Koeficient stanovení vzorce - Příklad č. 1

Řekněme, že máme dvě datové sady X a Y a každá obsahuje 20 náhodných datových bodů. Vypočítejte koeficient určení pro sadu dat X & Y.

Průměr se počítá jako:

  • Průměrná sada dat X = 48, 7
  • Průměrná sada dat Y = 42, 1

Nyní musíme vypočítat rozdíl mezi datovými body a střední hodnotou.

Podobně vypočítat pro všechny datové sady X.

Podobně ji vypočítejte také pro datovou sadu Y.

Vypočítejte druhou mocninu rozdílu pro datové sady X a Y.

Vynásobte rozdíl v X pomocí Y.

Koeficient korelace se vypočítá pomocí vzorce uvedeného níže

Korelační koeficient = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )

Koeficient stanovení se vypočítá pomocí vzorce uvedeného níže

Koeficient stanovení = (Koeficient korelace) 2

Koeficient stanovení = 13, 69%

Koeficient stanovení vzorce - Příklad č. 2

Řekněme, že jste velmi averzní investor a chcete investovat peníze na akciovém trhu. Nejste si jisti, do jakých akcií investovat, a také vaše nízká riziková chuť k jídlu. Chcete tedy investovat do akcií, které jsou bezpečné a mohou napodobovat výkonnost indexu. Váš přítel, který je aktivním investorem, pro vás vybral 3 akcie na základě jejich základních a technických informací a z těchto tří chcete vybrat 2 akcie.

Shromažďovali jste také informace o jejich historických návratech za posledních 15 let.

Korelační koeficient se počítá pomocí excelového vzorce

Koeficient stanovení se vypočítá pomocí vzorce uvedeného níže

Koeficient stanovení = (Koeficient korelace) 2

Na základě informací si vyberete akcie ABC a XYZ, které chcete investovat, protože mají nejvyšší koeficient určení.

Vysvětlení

Součinitel stanovení, jak je vysvětleno výše, je čtvercem korelace mezi dvěma datovými soubory. Pokud R2 je 0, znamená to, že neexistuje korelace a nezávislá proměnná nemůže předpovídat hodnotu závislé proměnné. Podobně, pokud je jeho hodnota 1, znamená to, že nezávislá proměnná bude vždy úspěšná při předpovídání závislé proměnné. Existují však i určitá omezení. Přestože nám říká korelaci mezi 2 datovými sadami, nehovoří nám, zda je tato hodnota dostatečná nebo ne.

Také velká hodnota R2 neznamená vždy, že tyto dvě proměnné mají silné vztahy a může to být náhoda. Například: Řekněme, že hodnota R2 mezi počtem automobilů prodaných za rok a počtem krabic se zmrzlinou prodaných za rok je 80%. Mezi těmito dvěma však neexistuje žádný vztah. Jeden by měl být při používání R2 velmi opatrný a nejprve porozumět datům a poté použít metodu

Relevance a použití koeficientu determinace

Existuje mnoho praktických aplikací R2. Například R2 je běžně používán investory k porovnání výkonnosti jejich portfolia s trhem a také k pokusu předpovídat budoucí směry. Podobně Hedge Funds use R2 pomáhá jim modelovat riziko ve svých modelech. Nakonec je však výsledek založen na čistých číslech a statistikách, které mohou být někdy zavádějící. Jak je uvedeno výše, je třeba nejprve zkontrolovat, zda má výstup R2 smysl v reálném životě nebo ne.

Doporučené články

Toto byl průvodce Coefficient of Determination Formula. Zde diskutujeme, jak vypočítat koeficient determinace spolu s praktickými příklady a šablonou Excel ke stažení. Další informace naleznete také v následujících článcích -

  1. Průvodce po vzorci tržního rizika
  2. Příklady vzorce pokrytí
  3. Kalkulačka pro výpočet nákladů podle vzorce
  4. Jak vypočítat poměr informací pomocí vzorce?