ANOVA (Analýza variace)

ANOVA je zkratka pro Analysis of Variance. ANOVA byla založena Ronaldem Fisherem v roce 1918. Název Analysis Of Variance byl odvozen na základě přístupu, ve kterém metoda používá rozptyl k určení prostředků, zda jsou různé nebo stejné.

Je to statistická metoda používaná k testování rozdílů mezi dvěma nebo více prostředky. Používá se k testování obecných rozdílů spíše než specifických rozdílů mezi prostředky. Hodnotí význam jednoho nebo více faktorů porovnáním prostředků proměnné odezvy na různých úrovních faktorů.

Nulová hypotéza říká, že všechny prostředky populace jsou si rovny. Alternativní hypotéza dokazuje, že průměr alespoň jedné populace je jiný

Poskytuje způsob, jak otestovat různé nulové hypotézy současně.

Obecný účel ANOVA

Důvodem provedení ANOVA je zjistit, zda existuje nějaký rozdíl mezi skupinami v nějaké proměnné. Vědci dnes používají ANOVA mnoha způsoby. Použití ANOVA zcela závisí na designu výzkumu.

T-test můžete použít k porovnání průměrů dvou vzorků, ale pokud existují více než dva vzorky, které mají být porovnány, pak je nejlepší metodou ANOVA.

Předpoklady ANOVA

Existují čtyři hlavní předpoklady

  • Očekávané hodnoty chyb jsou nulové
  • Rozptyly všech chyb jsou stejné
  • Chyby jsou nezávislé
  • Obvykle jsou distribuovány

Typy ANOVA

  1. Jedna cesta mezi skupinami

Jednosměrná ANOVA se používá ke kontrole, zda existuje nějaký významný rozdíl mezi prostředkem tří nebo více nesouvisejících skupin. Testuje hlavně nulovou hypotézu.

H₀: µ₁ = µ₂ = µ₃ = … .. = µₓ

Kde µ znamená střední skupinu a x znamená počet skupin. Jednosměrná ANOVA dává významný výsledek. Jedním ze způsobů je ANOVA statistika omnibusových testů a nedá vám vědět, které konkrétní skupiny se od sebe liší. Abyste poznali konkrétní skupinu nebo skupiny, které se lišily od ostatních, musíte provést post hoc test.

Příklad jednosměrné ANOVA

20 lidí je vybráno pro testování účinku pěti různých cviků. 20 lidí je rozděleno do 4 skupin po 5 členech. Jejich hmotnost se zaznamenává po několika dnech. Porovná se účinek cvičení na 5 skupin mužů. Zde je hmotnost jediným faktorem.

Předpoklady

Závislá proměnná je normálně distribuována v každé skupině

Existuje homogenita rozptylů

Nezávislost pozorování

  1. Jednosměrná ANOVA opakovala opatření

Opakovaná opatření ANOVA se víceméně rovná One Way ANOVA, ale používají se pro složitá seskupení. Opakovaná měření zkoumají 1. změny průměrného skóre za tři nebo více časových bodů

2. rozdíly v průměrném skóre za různých podmínek.

Příklad opakovaných opatření

Můžete zkoumat účinek šestiměsíčního cvičebního programu na snižování hmotnosti u některých jedinců. Váhu vypočítáváte ve třech různých okamžicích během tréninkového období, abyste si vytvořili časový kurs pro jakýkoli efekt cvičení.

Můžete si dopřát stejného jedince, aby jedl různé druhy hubnutí snižující jídlo a hodnotil je podle chuti.

V tomto příkladu se stejná skupina lidí měří více než jednou na stejné závislé proměnné.

  1. Obousměrně mezi skupinami

Dvoucestná ANOVA porovnává průměrný rozdíl mezi skupinami, které byly rozděleny na dva faktory. Hlavním cílem dvousměrné ANOVA je zjistit, zda existuje nějaká interakce mezi dvěma nezávislými proměnnými na závislých proměnných. Také vám umožní zjistit, zda je účinek jedné z vašich nezávislých proměnných na závislou proměnnou stejný pro všechny hodnoty vaší další nezávislé proměnné.

Příklad

Výzkum vlivu hnojiv na výnos rýže. Na každou z pěti pěstebních rýží nanášíte pět hnojiv různé kvality. Zaznamenává se výnos z každého pozemku a pozoruje se rozdíl mezi každým pozemkem. Zde lze také studovat vliv plodnosti pozemků. Existují tedy dva faktory, hnojivo a plodnost.

Předpoklady

Než začnete s obousměrnou ANOVA, měla by vaše data projít šesti předpoklady, abyste se ujistili, že vaše data jsou dostatečná pro provádění obousměrné ANOVA. Těchto šest předpokladů je uvedeno níže

  • Vaše závislá proměnná by měla být měřena na nepřetržité úrovni
  • Vaše dvě nezávislé proměnné by měly pro každou obsahovat dvě nebo více kategorií
  • Měli byste mít nezávislost na pozorováních
  • Vyvarujte se odlehlých hodnot
  • Vaše závislá proměnná by měla být normálně distribuována pro každou kombinaci skupin dvou nezávislých proměnných
  • Homogenita rozptylů
  1. Dvoucestná opakovaná opatření

Dvoucestné opakování měří průměrné rozdíly mezi skupinami, které byly rozděleny do dvou v rámci nezávislých proměnných. Ve výzkumu, kde se závislá proměnná měří více než dvakrát za dvou nebo více podmínek, se často používá obousměrné opakované měření.

Příklad

Zdravotní výzkumník chce najít nejlepší způsob, jak zmírnit chronickou bolest kloubů, kterou lidé trpí. Výzkumník vybírá dva různé typy ošetření, aby se snížila úroveň bolesti. Oba typy léčby jsou známé jako „podmínky“. Léčba A je masážní program a léčba B je akupunkturní program. Obě léčby se podávají všem pacientům po dobu 8 týdnů.

Pacienti jsou testováni ve třech časových bodech - na začátku programu, ve středu programu a na konci programu.

Výzkumný pracovník vybere 30 pacientů, kteří se zúčastní výzkumu. Když však prvních 15 pacientů podstoupí ošetření A, dalších 15 pacientů podstoupí ošetření B a naopak.

Na konci 8 týdnů výzkumník používá dvoucestná opakovaná měření ANOVA, aby zjistil, zda došlo k nějaké změně bolesti v důsledku interakce mezi typem léčby a v jakém časovém bodě.

Předpoklady

Vaše data by měla vyhovět pěti předpokladům, které jsou nutné pro obousměrně opakovaná měření ANOVA, aby bylo dosaženo přesného výsledku.

  • Vaše závislá proměnná by měla být měřena na nepřetržité úrovni
  • Vaše dva faktory v rámci předmětu by se měly skládat z nejméně dvou kategoricky souvisejících skupin
  • Neměli by existovat žádné odlehlé hodnoty
  • Závislá proměnná by měla být normálně rozdělena mezi každou kombinaci souvisejících skupin
  • Rozptyly rozdílů mezi všemi kombinacemi souvisejících skupin by měly být stejné

Parametrický a neparametrický test ANOVA

Pokud je informace o populaci pomocí jejích parametrů zcela známa, pak se provedený statistický test nazývá Parametrický test.

Pokud informace o populaci nebo parametrech nejsou známy, ale stále je třeba testovat hypotézu, pak se nazývá neparametrický test.

Pokud máte kategorická data, nemůžete použít metodu ANOVA, musíte použít test Chi square, který se zabývá interakcí ANOVA.

Postup testování hypotéz - jednosměrná ANOVA

  1. Zkontrolujte všechny nezbytné předpoklady a napište nulovou a alternativní hypotézu

Pro provedení jednosměrné ANOVA by měly existovat určité předpoklady. Předpoklady jsou následující

  • Každý vzorek je nezávislý náhodný vzorek
  • Distribuce proměnné odezvy následuje normální rozdělení
  • Rozdíly v populaci jsou stejné jako reakce na úrovně skupiny. To lze zjistit dělením největší směrodatné odchylky vzorku nejmenším standardem vzorku a není to větší než dva, pak se předpokládá, že rozdíly v populaci jsou stejné.
  1. Vypočítejte si vhodnou statistiku testu

Jedním způsobem ANOVA používá statistiku F testu. Ruční výpočty vyžadují mnoho kroků pro výpočet poměru F, ale statistický software jako SPSS vypočítá poměr F pro vás a vytvoří zdrojovou tabulku ANOVA.

Tabulka ANOVA vám poskytne informace o variabilitě mezi skupinami a uvnitř skupin. V tabulce jsou uvedeny všechny vzorce. Níže je uveden příklad jednosměrné tabulky ANOVA

ZdrojSSDFSLEČNAF
OšetřeníSSTk-1SST / (k-1)MST / MSE
ChybaSSENkSSE / (Nk)
Celkem (opraveno)SSN-1

SST znamená součet čtverců ošetření, SSE znamená součet čtverců chyb

DFT, což je k-1, znamená stupně volnosti pro zacházení, DFE, což je Nk, znamená stupně volnosti pro chyby.

  1. Určete hodnotu ap spojenou se statistikou testu
  2. Určete mezi nulovou a alternativní hypotézou

Pokud je nulová hypotéza nepravdivá, pak by MST měla být větší než MSE

  1. Uveďte závěr

Na základě vašeho výsledku napište závěr podle anova výzkumné otázky.

Více srovnávacích testů

Pokud zjistíte, že existuje významný rozdíl mezi skupinami, které nesouvisejí s chybou vzorkování, je nutné provést několik t testů, aby se otestovaly prostředky mezi skupinami. Bylo provedeno několik testů k řízení míry chybovosti prvního typu.

  • Scheffeův test
  • Modifikovaný test Bonferroni
  • Dunnetteův test
  • Tukeyův test

Výpočty

Výpočty ANOVA lze provádět třemi způsoby - ruční výpočty, listy Excel a software SPSS. Podívejme se na všechny výpočty podrobně níže

  1. Ruční výpočty ANOVA

  • Krok 1

Vypočítat CM

CM = (celkem všech pozorování) 2 / N celkem

  • Krok 2

Vypočítejte celkový SS

Celkem SS = součet čtverců všech pozorování - CM

  • Krok 3

Vypočítat SST (součet čtverců pro ošetření)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Krok 4

Vypočítat SSE (součet čtverců za chyby)

SSE = SS (celkem) - SST

  • Krok 5

Vypočítejte MST, MSE a jejich poměr F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA pomocí Excelu

Chcete-li provést jeden faktor ANOVA ve Excelu, postupujte podle těchto jednoduchých kroků

  • Přejděte na kartu Data
  • Klikněte na Analýza dat
  • Vyberte Anova: Single factor a klikněte na OK (existují i ​​další možnosti, jako Anova: two factor with replication a Anova: two factor with replication)
  • Klepněte na pole Vstupní rozsah a vyberte rozsah
  • Klepněte na pole Rozsah výstupu a vyberte rozsah výstupu a klepněte na tlačítko OK
  • Výsledek se zobrazí v listu Excel
  • Je-li F větší než Frit, je nulová hypotéza odmítnuta
  1. ANOVA pomocí SPSS

Nejprve si stáhněte software SPSS a proveďte ANOVA. Zde vidíme, jak provést jednosměrnou ANOVA pomocí SPSS

SPSS vždy předpokládá, že nezávislá proměnná je reprezentována číselně. Ve vzorové datové sadě je MAJOR řetězec. Nejprve tedy převeďte řetězcovou proměnnou na číselnou. Jakmile skončí vaše konverze, jste připraveni udělat ANOVA

  • Spusťte software SPSS
  • Klikněte na Analyzovat à Porovnat prostředky à One Way ANOVA
  • Na obrazovce se objeví jednosměrné dialogové okno ANOVA
  • Na levé straně dialogového okna se zobrazí seznam všech závislých proměnných, které jste změřili vy. Pomocí horního tlačítka se šipkou jej přesuňte do seznamu závislých na pravé straně
  • Stejným způsobem přesuňte nezávislou proměnnou v seznamu na levé straně do pole Faktor na pravé straně.
  • Klikněte na tlačítko Post Hoc a vyberte typ vícenásobného srovnání, které chcete provést.
  • Kliknutím na zaškrtávací políčko vedle testu vyberte libovolný test Post hoc, který vyhovuje vašemu výzkumu
  • Klikněte na Pokračovat a zobrazí se dialogové okno Jednosměrná ANOVA
  • Vyberte libovolnou statistiku a kliknutím na zaškrtávací políčka nalevo od možnosti ji vyberte
  • Klepnutím na položku Průběh prostředků získáte anov graf grafu podmínek
  • Klepněte na tlačítko Pokračovat a poté na tlačítko OK

Zobrazí se výstupní okno SPSS se šesti hlavními sekcemi

  • Popisná část
  • Test homogenity variací
  • ANOVA
  • Vícenásobná srovnání
  • Studijní průměr
  • Graf

Věci, které je třeba zvážit při spuštění ANOVA

Úroveň dat a předpoklady hrají v ANOVA klíčovou roli.

Výzkumník by měl zjistit, zda jsou data překřížena nebo vnořena. Pokud jsou data překročena, obdrží všechny skupiny všechny aspekty.

Pokud jsou data vnořena, pak každá skupina obdrží jinou metodu ANOVA.

Je důležitější vypočítat velikost anova efektu. Velikost efektu vám může říci, do jaké míry je nulová hypotéza nepravdivá. Vždy je upřednostňována střední velikost efektu

Doufám, že tento článek vám poskytl krátký přehled o ANOVA a interpretaci výsledků pomocí tohoto.

Související kurzy: -

  1. ANOVA pomocí Minitabu
  2. R Studio Anova Techniques Course

Kategorie: