Přehled Two Way ANOVA v R
Obousměrná ANOVA (Analysis of Variance) nám pomáhá pochopit vztah mezi jednou souvislou závislou proměnnou a dvěma kategoricky nezávislými proměnnými. V tomto tématu se budeme učit o Two Way ANOVA v R.
Níže jsou uvedeny hypotézy zájmu pod obousměrnou ANOVA
- H₀: Nazvěme to hlavní efekt, který je prvním faktorem závislým na spojité proměnné
- H₀: Hlavní účinek je také o účinku na druhou proměnnou na závislou spojitou proměnnou.
- H₀: Interakce je kombinovaný účinek první, druhé a druhé faktorové proměnné na závislou proměnnou
Níže jsou uvedeny normy, které musí obousměrná ANOVA splňovat.
- Pozorování musí být nezávislá
- Pozorování by měla být normálně distribuována.
- V pozorováních by měla být stejná rozptyl
- Žádné odlehlé hodnoty v designu
- Chyby by měly být nezávislé.
Poznámka
Pokud dojde k narušení normality a stejného rozptylu, musíme transformovat naše data.
Příklad dvousměrné ANOVA v R
Provedeme jednosměrný test ANOVA na souboru údajů o hladinách rakoviny, který obsahuje 48 řádků a 3 datové proměnné:
Čas převzatý: Čas přežití zvířete
Různé úrovně rakoviny 1 - 3
Ošetření: Ošetření použité od 1-3
Před testováním potřebujeme následující údaje v ruce.
- Import dat
- Odstraňte nepotřebnou proměnnou
- Převeďte proměnné (úrovně rakoviny) na uspořádanou úroveň.
Níže je sada dat.
Pozorování: 48
Proměnné: 3
doba přežití 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 40, 0, 23, 0, 22, 0…
úrovně rakoviny 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Ošetření A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, B, …
Cíle
- H₀: žádná změna průměrné doby přežití mezi skupinou
- H₀: doba přežití je u alespoň jedné skupiny jiná.
Kroky
- Zkontrolujte hladinu rakoviny. Vidíme tři hodnoty znaků, protože je převádíme na faktory s mutovaným slovesem.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Vypočítejte střední i standardní odchylku
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Výstup:
Tibble: 3 x 4
průměrný počet rakovinných stupňů průměrný čas sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 2776250 0, 06227627
- Ve třetím kroku můžete graficky zkontrolovat, zda existuje rozdíl mezi distribucemi. Všimněte si, že přidáte roztříštěnou tečku.
- Spusťte test příkazem AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntax:
y ~ X1 + X2 +… + Xn (X1 + X2 +… označuje nezávislé proměnné)
y ~. Použijte všechny zbývající proměnné jako nezávislé proměnné
Ujistěte se, že jste model uložili a vytiskli shrnutí.
Kód
- aov (čas ~ úroveň rakoviny, data = df): Spusťte test ANOVA s následujícím vzorcem
- shrnutí (anova_one_way): Vytiskne shrnutí testu
Df Sum Sq Průměrná hodnota Sq F Pr (> F)
Cancerlevels 2 1, 033 0, 5165 11, 79 7, 66e-05 ***
Zbytky 45 1, 972 0, 0438
-
Signif. kódy: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
Hodnota p je nižší než prahová hodnota 0, 05. Statistický rozdíl je ve výše uvedeném případě označen „*“.
One Way Test to Two Way Anova in R
Uvidíme, jak lze jednosměrný test rozšířit na obousměrnou ANOVA. Test je podobný jako jednocestná ANOVA, ale vzorec se liší a do vzorce přidává další skupinovou proměnnou.
y = x1 + x2
- H0 : Prostředky jsou stejné pro obě proměnné (faktorové proměnné)
- H3 : Prostředky se u obou proměnných liší
Do našeho modelu přidáte léčebné proměnné. Tato proměnná označuje léčbu poskytovanou pacientovi. Zajímá vás, zda existuje statistická závislost mezi hladinami rakoviny a léčbou poskytovanou pacientovi.
Upravíme náš kód přidáním ošetření s další nezávislou proměnnou.
Df Sum Sq Průměrná hodnota Sq F Pr (> F)
Hladiny rakoviny 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Ošetřit 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Zbytky 42 1, 0509 0, 0250
Hladiny rakoviny i léčba se statisticky liší od 0. Tímto způsobem můžeme odmítnout hypotézu NULL. Potvrďte také, že změna léčby nebo typu rakoviny ovlivňuje dobu přežití.
Test
Jednosměrná ANOVA: H3- Průměr se liší alespoň pro jednu skupinu
Obousměrná ANOVA: H3- Průměr se u obou skupin liší.
Rozdíl mezi jednocestnou a dvoucestnou ANOVA
Rozdíly mezi jednocestnou ANOVA a obousměrnou ANOVA
Jednosměrná ANOVA | Obousměrná ANOVA |
Navrženo tak, aby umožňovalo testování rovnosti mezi 3 a více prostředky | Navrženo k posouzení vzájemného vztahu dvou nezávislých proměnných na závislé proměnné. |
Zahrnuje jednu nezávislou proměnnou | Zahrnuje dvě nezávislé proměnné |
Analyzováno ve 3 nebo více kategoriích. | Porovná více skupin dvou faktorů |
Musí splňovat dva principy - replikaci a randomizaci | Musí splňovat tři zásady, kterými jsou replikace, randomizace a místní kontrola. |
Výhody dvousměrné ANOVA
- Ve výše uvedeném příkladu věk a pohlaví v našem příkladu pomáhají snižovat odchylky chyb a zvyšují efektivitu designu.
- Obousměrná ANOVA nám umožňuje testovat účinek dvou faktorů současně.
Aplikace ANOVA
- Porovnání ujetých kilometrů různých vozidel, paliv a typů silnic.
- Seznámení s vlivem teploty, tlaku nebo chemické koncentrace na některé chemické reakce (energetické reaktory, chemické závody atd.)
- Dopad různých katalyzátorů na rychlost chemické reakce
- Pochopení dopadu reklam a různého počtu reakcí zákazníků.
- Dopad výkonu, kvality a rychlosti výroby v biologii (proces založený na počtu buněk, na které se dělí)
Doporučené články
Toto je průvodce po dvoucestné ANOVA v R. Zde diskutujeme příklady, cíle, kroky a rozdíly mezi jednocestnou a obousměrnou ANOVA. Další informace naleznete také v následujících článcích -
- ANOVA v R
- Jak interpretovat výsledky pomocí testu ANOVA
- Regrese vs. ANOVA
- GLM v R