Polynomiální regrese Použití a vlastnosti polynomiální regrese

Úvod do polynomiální regrese

Regrese je definována jako metoda k nalezení vztahu mezi nezávislými a závislými proměnnými pro predikci výsledku. První polynomiální regresní model použil v roce 1815 Gergonne. Používá se k nalezení nejvhodnější linie pomocí regresní linie pro predikci výsledků. Existuje mnoho typů regresních technik, polynomiální regrese je jedním z nich. Než tomu porozumíme, je vhodné mít řádnou znalost lineární regrese, takže bude snadné označit rozdíly mezi nimi.

Proč polynomiální regrese?

Toto je jedna z regresních technik, které odborníci používají k předpovídání výsledku. Je definována jako vztah mezi nezávislými a závislými proměnnými, když závislá proměnná souvisí s nezávislou proměnnou mající n-tý stupeň. Nevyžaduje, aby byl vztah mezi závislými a nezávislými proměnnými lineární, takže pokud je čára křivka, může mít jakýkoli polynomiální člen.
Hlavní rozdíl mezi lineární a polynomiální regresí spočívá v tom, že lineární regrese vyžaduje, aby závislé a nezávislé proměnné byly lineárně vztaženy, zatímco to by lépe vyhovovalo linii, pokud do rovnice zahrneme jakýkoli vyšší stupeň nezávislého proměnného termínu. Rovnici polynomiální regrese mající n-tý stupeň lze napsat jako:

Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n

Pokud přidáme vyšší stupně, jako je kvadratický, pak to změní čáru na křivku, která lépe odpovídá datům. Obecně se používá, když jsou body v sadě dat rozptýleny a lineární model není schopen jasně popsat výsledek. Měli bychom vždy dávat pozor na overfitting a underfitting při zvažování těchto stupňů k rovnici.
Je lepší vzít v úvahu stupeň, který prochází všemi datovými body, ale někdy s vyšším stupněm, jako je 10 nebo 20, může projít všemi datovými body a snížit chybu, ale také zachycuje šum dat, která přesahují model, a Tomu lze zabránit přidáním dalších vzorků do souboru údajů o školení. Proto je vždy vhodné zvolit optimální míru, která odpovídá modelu.

Při rozhodování o stupni rovnice se používají dvě techniky:

Přední výběr: Jedná se o metodu zvyšování stupně, dokud není dostatečně významná pro definování modelu.
Zpětný výběr: Jedná se o metodu snižování stupně, dokud není dostatečně významná pro definování modelu.

Postup při použití polynomiální regrese

Níže naleznete kroky nebo postup pro použití polynomiální regrese na jakýkoli datový soubor:

Krok 1: Importujte příslušný datový soubor na jakoukoli platformu (R nebo Python) a nainstalujte požadované balíčky potřebné pro použití modelu.

Krok 2: Rozdělte datový soubor na tréninkové a testovací sady, abychom mohli použít algoritmus na sadu tréninkových dat a otestovat ji pomocí sady testovacích dat.

Krok 3: Použijte metody analýzy explorativních dat ke studiu pozadí dat, jako je průměr, medián, režim, první kvartil, druhý kvartil atd.

Krok 4: Použijte algoritmus lineární regrese na datový soubor a studujte model.

Krok 5: Použijte algoritmus polynomiální regrese na datový soubor a studujte model pro porovnání výsledků buď RMSE nebo R čtverce mezi lineární regresí a polynomiální regresí.

Krok 6: Vizualizujte a predikujte výsledky lineární i polynomiální regrese a identifikujte, který model předpovídá dataset s lepšími výsledky.

Použití polynomiální regrese

Používá se v mnoha experimentálních postupech k vytvoření výsledku pomocí této rovnice.
Poskytuje skvěle definovaný vztah mezi nezávislými a závislými proměnnými.
Používá se ke studiu izotopů sedimentů.
Používá se ke studiu výskytu různých nemocí v každé populaci.
Používá se ke studiu generace jakékoli syntézy.

Vlastnosti polynomiální regrese

Je to typ nelineární regresní metody, která nám říká vztah mezi nezávislou a závislou proměnnou, když závislá proměnná souvisí s nezávislou proměnnou n-tého stupně.
Nejvhodnější čára je určena stupněm polynomiální regresní rovnice.
Model odvozený z polynomiální regrese je ovlivněn odlehlými hodnotami, takže je vždy lepší ošetřit odlehlé hodnoty před použitím algoritmu na datový soubor.
Funkce Polynomialfeature () se převádí na rys matice v závislosti na stupni rovnice.
Povahu křivky lze studovat nebo vizualizovat pomocí jednoduchého rozptylového grafu, který vám poskytne lepší představu o vztahu linearity mezi proměnnými a podle toho se rozhodne.

Závěr

Polynomiální regrese se používá v mnoha organizacích, když identifikují nelineární vztah mezi nezávislými a závislými proměnnými. Je to jedna z obtížných regresních technik ve srovnání s jinými regresními metodami, takže hluboké znalosti o přístupu a algoritmu vám pomohou dosáhnout lepších výsledků.

Doporučené články

Toto je průvodce polynomiální regresí. Zde diskutujeme funkce a použití polynomiální regrese. Další informace naleznete také v dalších navrhovaných článcích -

Algoritmus SVM
Metody jádra
Funkce LINEST Excel
Algoritmy strojového učení
Lineární regrese vs. logická regrese Nejlepší rozdíly

Polynomiální regrese Použití a vlastnosti polynomiální regrese

Obsah:

Úvod do polynomiální regrese

Proč polynomiální regrese?

Postup při použití polynomiální regrese

Použití polynomiální regrese

Vlastnosti polynomiální regrese

Závěr

Doporučené články

Filmový pás Photo Collage ve Photoshopu - 2. část

Jak číst a porozumět histogramům obrázků ve Photoshopu

Nové rozvržení průvodce ve Photoshopu CC

Efekt malby Photoshop Pointillism

Pokročilé tipy a triky aplikace Photoshop Layer Masks

Příklad emoční inteligence - Prvky emoční inteligence

Emojis všude - 10 účinných způsobů využití emodži v marketingu

10 jednoduchých kroků k použití v průzkumu zpětné vazby zaměstnanců

Motivace zaměstnanců na pracovišti - motivace zaměstnanců 5 kroků

10 nejlepších způsobů, jak získat emoční inteligenci na pracovišti

10 důležitých otázek Java Multi-Threading Interview

Seznam Java vs Array List - Zjistěte 4 užitečné rozdíly

Java balíček - Příklad práce a kódování Java Package

Java balíčky - Jak vytvořit balíčky v Javě s příklady

Konvence pojmenování Java Syntaxe a příklad v názvové konvenci