Úvod do polynomiální regrese
Regrese je definována jako metoda k nalezení vztahu mezi nezávislými a závislými proměnnými pro predikci výsledku. První polynomiální regresní model použil v roce 1815 Gergonne. Používá se k nalezení nejvhodnější linie pomocí regresní linie pro predikci výsledků. Existuje mnoho typů regresních technik, polynomiální regrese je jedním z nich. Než tomu porozumíme, je vhodné mít řádnou znalost lineární regrese, takže bude snadné označit rozdíly mezi nimi.
Proč polynomiální regrese?
- Toto je jedna z regresních technik, které odborníci používají k předpovídání výsledku. Je definována jako vztah mezi nezávislými a závislými proměnnými, když závislá proměnná souvisí s nezávislou proměnnou mající n-tý stupeň. Nevyžaduje, aby byl vztah mezi závislými a nezávislými proměnnými lineární, takže pokud je čára křivka, může mít jakýkoli polynomiální člen.
- Hlavní rozdíl mezi lineární a polynomiální regresí spočívá v tom, že lineární regrese vyžaduje, aby závislé a nezávislé proměnné byly lineárně vztaženy, zatímco to by lépe vyhovovalo linii, pokud do rovnice zahrneme jakýkoli vyšší stupeň nezávislého proměnného termínu. Rovnici polynomiální regrese mající n-tý stupeň lze napsat jako:
Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n
- Pokud přidáme vyšší stupně, jako je kvadratický, pak to změní čáru na křivku, která lépe odpovídá datům. Obecně se používá, když jsou body v sadě dat rozptýleny a lineární model není schopen jasně popsat výsledek. Měli bychom vždy dávat pozor na overfitting a underfitting při zvažování těchto stupňů k rovnici.
- Je lepší vzít v úvahu stupeň, který prochází všemi datovými body, ale někdy s vyšším stupněm, jako je 10 nebo 20, může projít všemi datovými body a snížit chybu, ale také zachycuje šum dat, která přesahují model, a Tomu lze zabránit přidáním dalších vzorků do souboru údajů o školení. Proto je vždy vhodné zvolit optimální míru, která odpovídá modelu.
Při rozhodování o stupni rovnice se používají dvě techniky:
- Přední výběr: Jedná se o metodu zvyšování stupně, dokud není dostatečně významná pro definování modelu.
- Zpětný výběr: Jedná se o metodu snižování stupně, dokud není dostatečně významná pro definování modelu.
Postup při použití polynomiální regrese
Níže naleznete kroky nebo postup pro použití polynomiální regrese na jakýkoli datový soubor:
Krok 1: Importujte příslušný datový soubor na jakoukoli platformu (R nebo Python) a nainstalujte požadované balíčky potřebné pro použití modelu.
Krok 2: Rozdělte datový soubor na tréninkové a testovací sady, abychom mohli použít algoritmus na sadu tréninkových dat a otestovat ji pomocí sady testovacích dat.
Krok 3: Použijte metody analýzy explorativních dat ke studiu pozadí dat, jako je průměr, medián, režim, první kvartil, druhý kvartil atd.
Krok 4: Použijte algoritmus lineární regrese na datový soubor a studujte model.
Krok 5: Použijte algoritmus polynomiální regrese na datový soubor a studujte model pro porovnání výsledků buď RMSE nebo R čtverce mezi lineární regresí a polynomiální regresí.
Krok 6: Vizualizujte a predikujte výsledky lineární i polynomiální regrese a identifikujte, který model předpovídá dataset s lepšími výsledky.
Použití polynomiální regrese
- Používá se v mnoha experimentálních postupech k vytvoření výsledku pomocí této rovnice.
- Poskytuje skvěle definovaný vztah mezi nezávislými a závislými proměnnými.
- Používá se ke studiu izotopů sedimentů.
- Používá se ke studiu výskytu různých nemocí v každé populaci.
- Používá se ke studiu generace jakékoli syntézy.
Vlastnosti polynomiální regrese
- Je to typ nelineární regresní metody, která nám říká vztah mezi nezávislou a závislou proměnnou, když závislá proměnná souvisí s nezávislou proměnnou n-tého stupně.
- Nejvhodnější čára je určena stupněm polynomiální regresní rovnice.
- Model odvozený z polynomiální regrese je ovlivněn odlehlými hodnotami, takže je vždy lepší ošetřit odlehlé hodnoty před použitím algoritmu na datový soubor.
- Funkce Polynomialfeature () se převádí na rys matice v závislosti na stupni rovnice.
- Povahu křivky lze studovat nebo vizualizovat pomocí jednoduchého rozptylového grafu, který vám poskytne lepší představu o vztahu linearity mezi proměnnými a podle toho se rozhodne.
Závěr
Polynomiální regrese se používá v mnoha organizacích, když identifikují nelineární vztah mezi nezávislými a závislými proměnnými. Je to jedna z obtížných regresních technik ve srovnání s jinými regresními metodami, takže hluboké znalosti o přístupu a algoritmu vám pomohou dosáhnout lepších výsledků.
Doporučené články
Toto je průvodce polynomiální regresí. Zde diskutujeme funkce a použití polynomiální regrese. Další informace naleznete také v dalších navrhovaných článcích -
- Algoritmus SVM
- Metody jádra
- Funkce LINEST Excel
- Algoritmy strojového učení
- Lineární regrese vs. logická regrese Nejlepší rozdíly