Úvod do polynomiální regrese

Regrese je definována jako metoda k nalezení vztahu mezi nezávislými a závislými proměnnými pro predikci výsledku. První polynomiální regresní model použil v roce 1815 Gergonne. Používá se k nalezení nejvhodnější linie pomocí regresní linie pro predikci výsledků. Existuje mnoho typů regresních technik, polynomiální regrese je jedním z nich. Než tomu porozumíme, je vhodné mít řádnou znalost lineární regrese, takže bude snadné označit rozdíly mezi nimi.

Proč polynomiální regrese?

  • Toto je jedna z regresních technik, které odborníci používají k předpovídání výsledku. Je definována jako vztah mezi nezávislými a závislými proměnnými, když závislá proměnná souvisí s nezávislou proměnnou mající n-tý stupeň. Nevyžaduje, aby byl vztah mezi závislými a nezávislými proměnnými lineární, takže pokud je čára křivka, může mít jakýkoli polynomiální člen.
  • Hlavní rozdíl mezi lineární a polynomiální regresí spočívá v tom, že lineární regrese vyžaduje, aby závislé a nezávislé proměnné byly lineárně vztaženy, zatímco to by lépe vyhovovalo linii, pokud do rovnice zahrneme jakýkoli vyšší stupeň nezávislého proměnného termínu. Rovnici polynomiální regrese mající n-tý stupeň lze napsat jako:

Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n

  • Pokud přidáme vyšší stupně, jako je kvadratický, pak to změní čáru na křivku, která lépe odpovídá datům. Obecně se používá, když jsou body v sadě dat rozptýleny a lineární model není schopen jasně popsat výsledek. Měli bychom vždy dávat pozor na overfitting a underfitting při zvažování těchto stupňů k rovnici.
  • Je lepší vzít v úvahu stupeň, který prochází všemi datovými body, ale někdy s vyšším stupněm, jako je 10 nebo 20, může projít všemi datovými body a snížit chybu, ale také zachycuje šum dat, která přesahují model, a Tomu lze zabránit přidáním dalších vzorků do souboru údajů o školení. Proto je vždy vhodné zvolit optimální míru, která odpovídá modelu.

Při rozhodování o stupni rovnice se používají dvě techniky:

  • Přední výběr: Jedná se o metodu zvyšování stupně, dokud není dostatečně významná pro definování modelu.
  • Zpětný výběr: Jedná se o metodu snižování stupně, dokud není dostatečně významná pro definování modelu.

Postup při použití polynomiální regrese

Níže naleznete kroky nebo postup pro použití polynomiální regrese na jakýkoli datový soubor:

Krok 1: Importujte příslušný datový soubor na jakoukoli platformu (R nebo Python) a nainstalujte požadované balíčky potřebné pro použití modelu.

Krok 2: Rozdělte datový soubor na tréninkové a testovací sady, abychom mohli použít algoritmus na sadu tréninkových dat a otestovat ji pomocí sady testovacích dat.

Krok 3: Použijte metody analýzy explorativních dat ke studiu pozadí dat, jako je průměr, medián, režim, první kvartil, druhý kvartil atd.

Krok 4: Použijte algoritmus lineární regrese na datový soubor a studujte model.

Krok 5: Použijte algoritmus polynomiální regrese na datový soubor a studujte model pro porovnání výsledků buď RMSE nebo R čtverce mezi lineární regresí a polynomiální regresí.

Krok 6: Vizualizujte a predikujte výsledky lineární i polynomiální regrese a identifikujte, který model předpovídá dataset s lepšími výsledky.

Použití polynomiální regrese

  • Používá se v mnoha experimentálních postupech k vytvoření výsledku pomocí této rovnice.
  • Poskytuje skvěle definovaný vztah mezi nezávislými a závislými proměnnými.
  • Používá se ke studiu izotopů sedimentů.
  • Používá se ke studiu výskytu různých nemocí v každé populaci.
  • Používá se ke studiu generace jakékoli syntézy.

Vlastnosti polynomiální regrese

  • Je to typ nelineární regresní metody, která nám říká vztah mezi nezávislou a závislou proměnnou, když závislá proměnná souvisí s nezávislou proměnnou n-tého stupně.
  • Nejvhodnější čára je určena stupněm polynomiální regresní rovnice.
  • Model odvozený z polynomiální regrese je ovlivněn odlehlými hodnotami, takže je vždy lepší ošetřit odlehlé hodnoty před použitím algoritmu na datový soubor.
  • Funkce Polynomialfeature () se převádí na rys matice v závislosti na stupni rovnice.
  • Povahu křivky lze studovat nebo vizualizovat pomocí jednoduchého rozptylového grafu, který vám poskytne lepší představu o vztahu linearity mezi proměnnými a podle toho se rozhodne.

Závěr

Polynomiální regrese se používá v mnoha organizacích, když identifikují nelineární vztah mezi nezávislými a závislými proměnnými. Je to jedna z obtížných regresních technik ve srovnání s jinými regresními metodami, takže hluboké znalosti o přístupu a algoritmu vám pomohou dosáhnout lepších výsledků.

Doporučené články

Toto je průvodce polynomiální regresí. Zde diskutujeme funkce a použití polynomiální regrese. Další informace naleznete také v dalších navrhovaných článcích -

  1. Algoritmus SVM
  2. Metody jádra
  3. Funkce LINEST Excel
  4. Algoritmy strojového učení
  5. Lineární regrese vs. logická regrese Nejlepší rozdíly

Kategorie: