Algoritmus zvyšování gradientu Kompletní průvodce zvyšováním přechodu

Obsah:

Anonim

Úvod do algoritmu Gradient Boosting Algorithm

Technika přechodu týdenních studentů na silného studenta se nazývá Boosting. Proces algoritmu zvyšujícího gradient pracuje na této teorii provádění. Alba boosting algoritmus může být zobrazen vysvětlit a snadno pochopit proces, kterým je boosting vstřikován do datových sad.

Rozhodovací strom

Strom rozhodnutí je nástroj podpory verdiktu, který určuje rozhodnutí implikováním stromového typu a jejich pravděpodobných důsledků, spolu s možnými výstupy událostí, náklady na zdroje atd. Tato technika jim umožňuje zobrazit kontrolní příkazy, které fungují na podmíněných výstupech.

Výzkumné operace široce využívají tyto rozhodovací stromy konkrétně v rozhodovací analýze. Také jim to umožňuje dosáhnout cíle a je také obdivovaným nástrojem ve strojovém učení.

AdaBoost Algoritmus

Algoritmus AdaBoost začíná přípravou rozhodovacího stromu, ve kterém je každému pozorování přidělena ekvivalentní váha. Po posouzení primárního stromu zvyšujeme hmotnosti této interpretace, které je obtížné kategorizovat a podřídit hmotnosti těm, kteří je bez námahy kategorizovat. Druhý strom je výsledkem vývoje těchto předsudků. Zde je cílem lépe se proroctví primárního stromu.

Potom vypočítejte chybu kategorizace z tohoto inovativního modelu kolekce dvou stromů a kultivujte třetí strom, aby se předvídaly modifikované zbytky. Výše uvedený postup je opakován v několika případech. Pozorování, která nejsou v předchozích stromech dobře definována, se stanoví pomocí následujících stromů. Predikce modelu závěrečné sestavy jsou tedy předpojatou postavou předpovědí ukončených dřívějšími modely stromů.

Výcvikový model GBM

Aby bylo možné instruovat model gbm v jazyce R, musí být nainstalována knihovna GBM a je vyvoláno volání do této nainstalované knihovny GBM z volajícího programu. Rovněž je třeba zadat potřebné argumenty, klíčové argumenty jsou uvedeny níže,

1. Vzorec

2. Rozdělení proměnných odezvy

3. Prediktorová proměnná

4. Proměnná odezvy

Obvyklé distribuce používané v GBM modelech jsou Bernoulli, Poisson atd.

Nakonec se očekává, že budou specifikována data a argumenty n.trees. Ve výchozím nastavení bude model gbm brát za zaručených 100 stromů, což může nabídnout, je kvalitní aproximace koncertu našeho gbm.

Ukázkový kód # 1

install.packages ("gbm")
library(gbm)
GBM <- gbm( formula = response,
distribution = " bernoulli ",
data = train
n.trees = 3000)

Zde je další krok, kdy je skutečná datová sada rozdělena na rozdělení datové sady vlaků a testů, čehož je dosaženo pomocí funkce createDataPartition (). Tento druh rozdělení bude velmi užitečný v pozdější části pro trénink zkušební sady pomocí trénované vlakové soupravy a její vrchol, kde jsou stanoveny skutečné předpovědi pro původní data.

Ukázkový kód # 2

TRAIN <- read.csv("Train_dd.csv")
set.seed(77820)
intrain <- createDataPartition( y = Train$survived,
list = false )
Train <- Train(inTrain) Train <- Train(-inTrain)

Dalším krokem je trénovat model gbm pomocí našeho tréninkového profesionála. Zatímco všechny další argumenty jsou přesně to, co bylo oznámeno ve výše uvedených oddílech. jsou zmíněny dva další argumenty - interakce, hloubka a smrštění.

1. Hloubka interakce vyhláskuje maximální hloubku každého stromu

2. Měření rychlosti intelektu je dosaženo pomocí smrštění. zde se pomocí tohoto smrštění sníží všechny doplňkové hodnoty v základních stromech žáků.

Tato technika navíc umožňuje zobrazovat řídicí příkazy, které pracují s podmíněnými výstupy. Výzkumné operace široce používají tyto rozhodovací stromy konkrétně v rozhodovací analýze. Také nám to umožňuje dosáhnout cíle a jsou také obdivovaným nástrojem v strojovém učení.

Výstup modelu GBM

Výstup modelu GBM obsahuje podrobnosti o celkovém počtu stromů předpokládaných pro provedení. To pomůže předpovídat vliv prediktorové proměnné v modelu, také tabulka proměnné důležitosti a modelový graf lze odvodit ze souhrnné funkce výstupu GBM.

Metoda predict () používající model GBM

Takže pro vytvoření předpovědí na vrcholu klíčovaných dat zde modelu GBM, stejně jako u jiných modelů, je předpokládána metoda predikce. V části argumentů metody musí být také ručně uveden počet použitých celkových rozhodovacích stromů.

Ukázkový kód

predictions <- predict( object = simpleGBMmodel,
newdata = test,
n.trees = 1)

Vylepšení modelu GBM

Omezení stromů

  • Je důležité, že slabí studenti zahrnují dovednosti, ale zůstávají slabí.

Vážené aktualizace

  • Postupně se přidává z předpovědí každého stromu
  • Dar každého stromu do této částky musí být masový, aby zpomalil učení algoritmu. tento proces se nazývá smršťování.

Algoritmus stochastického přechodu

Tento ekvivalentní zisk lze použít ke snížení asociace lemované stromy.

Algoritmus penalizovaného přechodu

Parametrizované stromy lze doplnit dalšími omezeními, klasický rozhodovací strom nelze použít jako slabé studenty. Místo toho se používá přizpůsobený tzv. Regresní strom, který má číselné hodnoty v uzlech listů.

Doporučené články

Toto byl průvodce algoritmem pro podporu přechodu. Zde diskutujeme úvod, rozhodovací strom, algoritmus AdaBoost, tréninkový model GBM, vylepšení modelu GBM spolu s ukázkovým kódem. Další informace naleznete také v dalších navrhovaných článcích -
  1. Algoritmus rozhodovacího stromu
  2. Algoritmy strojového učení
  3. XGBoostní algoritmus
  4. Algoritmy pro vědu o datech
  5. Algoritmus C ++ | Příklady algoritmu C ++
  6. Implementace Poissonovy regrese v R