Přehled náhodného lesního algoritmu

Algoritmy jsou sadou kroků, které se provádějí při provádění komplexního výpočtu pro řešení problémů. Algoritmy jsou vytvářeny k řešení problémů strojového učení. Algoritmus náhodného lesa je jeden takový algoritmus používaný pro strojové učení. Používá se k trénování dat na základě dříve přiváděných údajů a předpovídání možného výsledku pro budoucnost. Je to velmi populární a výkonný algoritmus strojového učení.

Pochopení algoritmu náhodného lesa

Algoritmus náhodných domén je založen na učení pod dohledem. Může být použit pro regresní i klasifikační problémy. Jak název napovídá, na náhodné lesy lze pohlížet jako na soubor algoritmů více rozhodovacích stromů s náhodným vzorkováním. Tento algoritmus je určen k odstranění nedostatků algoritmu stromu rozhodování.

Náhodný les je kombinací Breimanovy myšlenky „pytlování“ a náhodného výběru funkcí. Cílem je zpřesnit předpověď tím, že se vezme průměr nebo režim výstupu více rozhodovacích stromů. Čím větší počet rozhodovacích stromů je považován, tím přesnější bude výstup.

Práce v náhodném lese:

Abychom pochopili fungování náhodného lesa, nejdřív musíme pochopit fungování stromu rozhodování, protože náhodný les je založen na rozhodovacích stromech.

Strom rozhodnutí -

Je to jednoduchý, ale populární algoritmus, který sleduje přístup shora dolů. Každý uzel ve stromu rozhodování představuje atribut a list představuje výsledek. Větve, která spojují uzly s listy, jsou rozhodnutí nebo pravidla pro predikci. Kořenový uzel je atribut, který nejlépe popisuje soubor dat o školení. Celý proces je tedy diagramován do stromové struktury.

Omezení stromu rozhodování: Má tendenci přeplňovat se na datový soubor školení. Tudíž při použití s ​​testem nebo různými výsledky sady dat se mohou lišit. Vede to ke špatným rozhodnutím. Stromy mohou být nestabilní, protože mírná změna dat může vést ke zcela jinému stromu.

Náhodný les používá metodu pytlování k dosažení požadovaného výsledku. Cílem je použít algoritmus rozhodovacího stromu na datový soubor, ale pokaždé s různými vzorky tréninkových dat. Výstup z těchto rozhodovacích stromů bude odlišný a může být zkreslený na základě tréninkových dat přiváděných do algoritmu. Takže konečný výstup lze brát jako průměr nebo režim výstupu jednotlivého stromu rozhodování. Rozptyl tedy může být snížen. Odběr vzorků lze provést s výměnou. Výstupy rozhodovacích stromů jsou seřazeny a ten s nejvyšším hodnocením bude výsledným výstupem Random Forest. Takto bude získaný výstup méně zkreslený a stabilnější.

Význam náhodného lesního algoritmu:

  • Algoritmus náhodného lesa lze použít pro regresní i klasifikační modely strojového učení.
  • Může také zpracovat chybějící hodnoty v datové sadě.
  • Na rozdíl od stromu rozhodování nepřevyšuje model a lze jej použít také pro kategoriální proměnné. Náhodný les přidává modelu náhodnost.
  • Na rozdíl od rozhodovacích stromů, místo prohledávání jediné nejdůležitější funkce pro sestavení rozhodovacího stromu kolem, hledá nejlepší funkce pomocí náhodné podmnožiny prvků pro stromy.
  • A pak vygenerujte výstup na základě nejvýše hodnoceného výstupu rozhodovacích stromů podmnožiny.

Příklad skutečného života

Předpokládejme, že dívka jménem Lisa chce založit knihu, a tak šla k jednomu ze svých přátel Davidovi a požádala ho o jeho návrh. Navrhl Lisu knihu založenou na spisovatelce, kterého četla. Podobně šla za svými návrhy k několika dalším přátelům a na základě žánru, autora a vydavatele navrhla některé knihy. Z toho udělala seznam. Pak si koupila knihu, kterou navrhla většina jejích přátel.

Předpokládejme, že její přátelé jsou strom rozhodování a žánr, autor, vydavatel atd. Jsou rysy dat. Lisa jde tedy na různé přátele, což jsou reprezentace různých rozhodovacích stromů. Výstupem algoritmu je proto kniha, která získala většinu hlasů.

Aplikace náhodného lesního algoritmu:

  • Algoritmus náhodného lesa se používá v mnoha oblastech, jako je bankovnictví, elektronický obchod, medicína, akciový trh atd.
  • V bankovnictví se používá k určení věrných zákazníků a podvodníků. Slouží ke zjištění, který zákazník bude schopen splácet půjčku. Protože v bankovnictví je velmi důležité poskytovat půjčky pouze těm zákazníkům, kteří ji budou schopni včas splácet. Také se používá náhodná doménová struktura k předpovědi, zda je zákazník podvodný nebo ne. Růst banky závisí na takovém typu predikce.
  • V oblasti medicíny se náhodný les používá k diagnostice onemocnění na základě pacientských minulých lékařských záznamů.
  • Na akciovém trhu se náhodný les používá k identifikaci trhu a chování populace.
  • V oblasti elektronického obchodování se tento algoritmus používá k předpovídání preferencí zákazníka na základě minulého chování.

Výhoda:

  • Jak bylo uvedeno výše, algoritmus náhodných doménových struktur lze použít pro regresní i klasifikační typ problému. Snadno se používá. Přeplnění datové sady není problém v algoritmu náhodných doménových struktur.
  • Může být použit k identifikaci nejdůležitější funkce z dostupných funkcí. S použitím hyperparametru se často vytvářejí dobré předpovědi a je velmi snadné to pochopit.
  • Náhodný les má vysokou přesnost, flexibilitu a menší rozptyl.

Nevýhoda:

  • S rostoucím počtem stromů se algoritmus stává pomalým a neúčinným při zpracování scénářů v reálném čase.
  • Náhodný les je ve srovnání se stromem rozhodování časově náročnější.
  • Vyžaduje také více prostředků pro výpočet.

Příklady: Společnosti používají algoritmy strojového učení, aby lépe porozuměli svým zákazníkům a rozvíjeli své podnikání. K pochopení preferencí zákazníka lze použít náhodný algoritmus doménové struktury. Může být také použit k předpovědi pravděpodobnosti, že osoba kupuje určitý produkt. Předpokládejme, že vzhledem k vlastnostem, jako je hmotnost, výška, barva, průměr, spotřeba paliva atd., Může společnost předvídat, zda bude nebo nebude úspěšným produktem na trhu. Může být použit k identifikaci faktorů odpovědných za vysoký prodej.

Závěr:

Algoritmus náhodných domén je snadno použitelný a efektivní algoritmus. Může to předpovídat s vysokou přesností, a proto je velmi populární.

Doporučené články

Toto byl průvodce Random Forest Algorithm. Zde diskutujeme práci, porozumění, důležitost, aplikaci, výhody a nevýhody algoritmu náhodného lesa. Další informace naleznete také v dalších navrhovaných článcích -

  1. Co je to algoritmus?
  2. Algoritmus Naive Bayes
  3. Co je to chamtivý algoritmus?
  4. Co je to datové jezero?
  5. Nejpoužívanější techniky učení souboru

Kategorie: