Obousměrná ANOVA v R - Obousměrný test ANOVA v R Snadný průvodce Příklady

Obsah:

Anonim

Přehled Two Way ANOVA v R

Obousměrná ANOVA (Analysis of Variance) nám pomáhá pochopit vztah mezi jednou souvislou závislou proměnnou a dvěma kategoricky nezávislými proměnnými. V tomto tématu se budeme učit o Two Way ANOVA v R.

Níže jsou uvedeny hypotézy zájmu pod obousměrnou ANOVA

  1. H₀: Nazvěme to hlavní efekt, který je prvním faktorem závislým na spojité proměnné
  2. H₀: Hlavní účinek je také o účinku na druhou proměnnou na závislou spojitou proměnnou.
  3. H₀: Interakce je kombinovaný účinek první, druhé a druhé faktorové proměnné na závislou proměnnou

Níže jsou uvedeny normy, které musí obousměrná ANOVA splňovat.

  1. Pozorování musí být nezávislá
  2. Pozorování by měla být normálně distribuována.
  3. V pozorováních by měla být stejná rozptyl
  4. Žádné odlehlé hodnoty v designu
  5. Chyby by měly být nezávislé.

Poznámka

Pokud dojde k narušení normality a stejného rozptylu, musíme transformovat naše data.

Příklad dvousměrné ANOVA v R

Provedeme jednosměrný test ANOVA na souboru údajů o hladinách rakoviny, který obsahuje 48 řádků a 3 datové proměnné:

Čas převzatý: Čas přežití zvířete

Různé úrovně rakoviny 1 - 3

Ošetření: Ošetření použité od 1-3

Před testováním potřebujeme následující údaje v ruce.

  • Import dat
  • Odstraňte nepotřebnou proměnnou
  • Převeďte proměnné (úrovně rakoviny) na uspořádanou úroveň.

Níže je sada dat.

Pozorování: 48

Proměnné: 3

doba přežití 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 40, 0, 23, 0, 22, 0…

úrovně rakoviny 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…

Ošetření A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, B, …

Cíle

  1. H₀: žádná změna průměrné doby přežití mezi skupinou
  2. H₀: doba přežití je u alespoň jedné skupiny jiná.

Kroky

  • Zkontrolujte hladinu rakoviny. Vidíme tři hodnoty znaků, protože je převádíme na faktory s mutovaným slovesem.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Vypočítejte střední i standardní odchylku

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Výstup:

Tibble: 3 x 4

průměrný počet rakovinných stupňů průměrný čas sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 2776250 0, 06227627

  • Ve třetím kroku můžete graficky zkontrolovat, zda existuje rozdíl mezi distribucemi. Všimněte si, že přidáte roztříštěnou tečku.
  • Spusťte test příkazem AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Syntax:

y ~ X1 + X2 +… + Xn (X1 + X2 +… označuje nezávislé proměnné)

y ~. Použijte všechny zbývající proměnné jako nezávislé proměnné

Ujistěte se, že jste model uložili a vytiskli shrnutí.

Kód

  • aov (čas ~ úroveň rakoviny, data = df): Spusťte test ANOVA s následujícím vzorcem
  • shrnutí (anova_one_way): Vytiskne shrnutí testu

Df Sum Sq Průměrná hodnota Sq F Pr (> F)

Cancerlevels 2 1, 033 0, 5165 11, 79 7, 66e-05 ***

Zbytky 45 1, 972 0, 0438

-

Signif. kódy: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1

Hodnota p je nižší než prahová hodnota 0, 05. Statistický rozdíl je ve výše uvedeném případě označen „*“.

One Way Test to Two Way Anova in R

Uvidíme, jak lze jednosměrný test rozšířit na obousměrnou ANOVA. Test je podobný jako jednocestná ANOVA, ale vzorec se liší a do vzorce přidává další skupinovou proměnnou.

y = x1 + x2

  • H0 : Prostředky jsou stejné pro obě proměnné (faktorové proměnné)
  • H3 : Prostředky se u obou proměnných liší

Do našeho modelu přidáte léčebné proměnné. Tato proměnná označuje léčbu poskytovanou pacientovi. Zajímá vás, zda existuje statistická závislost mezi hladinami rakoviny a léčbou poskytovanou pacientovi.

Upravíme náš kód přidáním ošetření s další nezávislou proměnnou.

Df Sum Sq Průměrná hodnota Sq F Pr (> F)

Hladiny rakoviny 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***

Ošetřit 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Zbytky 42 1, 0509 0, 0250

Hladiny rakoviny i léčba se statisticky liší od 0. Tímto způsobem můžeme odmítnout hypotézu NULL. Potvrďte také, že změna léčby nebo typu rakoviny ovlivňuje dobu přežití.

Test

Jednosměrná ANOVA: H3- Průměr se liší alespoň pro jednu skupinu

Obousměrná ANOVA: H3- Průměr se u obou skupin liší.

Rozdíl mezi jednocestnou a dvoucestnou ANOVA

Rozdíly mezi jednocestnou ANOVA a obousměrnou ANOVA

Jednosměrná ANOVAObousměrná ANOVA
Navrženo tak, aby umožňovalo testování rovnosti mezi 3 a více prostředkyNavrženo k posouzení vzájemného vztahu dvou nezávislých proměnných na závislé proměnné.
Zahrnuje jednu nezávislou proměnnouZahrnuje dvě nezávislé proměnné
Analyzováno ve 3 nebo více kategoriích.Porovná více skupin dvou faktorů
Musí splňovat dva principy - replikaci a randomizaciMusí splňovat tři zásady, kterými jsou replikace, randomizace a místní kontrola.

Výhody dvousměrné ANOVA

  • Ve výše uvedeném příkladu věk a pohlaví v našem příkladu pomáhají snižovat odchylky chyb a zvyšují efektivitu designu.
  • Obousměrná ANOVA nám umožňuje testovat účinek dvou faktorů současně.

Aplikace ANOVA

  1. Porovnání ujetých kilometrů různých vozidel, paliv a typů silnic.
  2. Seznámení s vlivem teploty, tlaku nebo chemické koncentrace na některé chemické reakce (energetické reaktory, chemické závody atd.)
  3. Dopad různých katalyzátorů na rychlost chemické reakce
  4. Pochopení dopadu reklam a různého počtu reakcí zákazníků.
  5. Dopad výkonu, kvality a rychlosti výroby v biologii (proces založený na počtu buněk, na které se dělí)

Doporučené články

Toto je průvodce po dvoucestné ANOVA v R. Zde diskutujeme příklady, cíle, kroky a rozdíly mezi jednocestnou a obousměrnou ANOVA. Další informace naleznete také v následujících článcích -

  1. ANOVA v R
  2. Jak interpretovat výsledky pomocí testu ANOVA
  3. Regrese vs. ANOVA
  4. GLM v R