Rozdíly mezi supervidovaným učením a hlubokým učením

Při učení pod dohledem zahrnují data školení, která do algoritmu vkládáte, požadovaná řešení, která se nazývají štítky. Typickým kontrolovaným úkolem učení je klasifikace. Dobrým příkladem je spamový filtr: je školen s mnoha příklady e-mailů spolu se svou třídou (spam nebo šunka) a musí se naučit, jak klasifikovat nové e-maily.

Hluboké učení je pokus napodobit aktivitu ve vrstvách neuronů v neokortexu, což je asi 80% mozku, kde dochází k myšlení (v lidském mozku je okolo 100 miliard neuronů a 100–1 000 bilionů synapsí). Říká se tomu hluboká, protože má více než jednu skrytou vrstvu neuronů, které pomáhají mít více stavů nelineární transformace rysů

Srovnání přímého učení supervidovaného učení vs hlubokého učení (infografika)

Níže je pět nejlepších srovnání mezi supervidovaným učením a hlubokým učením

Klíčové rozdíly mezi supervidovaným učením a hlubokým učením

Obě supervidované učení vs hluboké učení jsou populární volby na trhu; pojďme diskutovat o některých hlavních rozdílech mezi supervidovaným učením a hlubokým učením:

● Hlavní modely -

Důležité sledované modely jsou -

k-Nearest Neighbors - Používá se pro klasifikaci a regresi
Lineární regrese - Pro predikci / regresi
Logistická regrese - pro klasifikaci
Support Vector Machines (SVM) - Používá se pro klasifikaci a regresi
Rozhodovací stromy a náhodné lesy - úkoly klasifikace i regrese

Nejoblíbenější Deep neuronové sítě:

Vícevrstvé perceptrony (MLP) - nejzákladnější typ. Tato síť je obecně počáteční fází budování dalších sofistikovanějších hlubokých sítí a může být použita pro jakékoli kontrolované regresní nebo klasifikační problémy.

Autoencoders (AE) - Síť má nepodložené učební algoritmy pro učení funkcí, zmenšení rozměrů a detekci odlehlých hodnot

Konvoluční neuronová síť (CNN) - zvláště vhodná pro prostorová data, rozpoznávání objektů a analýzu obrazu pomocí vícerozměrných neuronových struktur. Jedním z hlavních důvodů popularity hlubokého učení v poslední době je díky CNN.

Recurrent Neural Network (RNN) - RNN se používají pro sekvenční analýzu dat, jako jsou časové řady, analýza sentimentu, NLP, překlad jazyka, rozpoznávání řeči, titulky obrázků. Jedním z nejčastějších typů modelu RNN je síť Long Short-Term Memory (LSTM).

Data o školení - Jak již bylo zmíněno, modely pod dohledem vyžadují údaje o školení se štítky. Hluboké učení však dokáže zpracovat data s nebo bez štítků. Některé architektury neuronových sítí mohou být bez dozoru, jako jsou autoenkodéry a omezené Boltzmannovy stroje

Výběr prvku - Některé modely pod dohledem jsou schopny analyzovat funkce a vybrat podmnožinu prvků pro určení cíle. Většinou to však musí být ve fázi přípravy dat. V Deep Neuronových sítích se však objevují nové funkce a nežádoucí prvky jsou vyřazovány jako pokrok v učení.

Reprezentace dat - U klasických modelů pod dohledem se nevytváří abstrakce vstupních funkcí na vysoké úrovni. Finální model se snaží předpovídat výstup pomocí matematických transformací na podmnožinu vstupních funkcí.
V hlubokých neuronových sítích jsou interně vytvářeny abstrakce vstupních prvků. Například při překladu textu neuronová síť nejprve převede vstupní text na interní kódování a poté transformuje tuto abstrakční reprezentaci do cílového jazyka.

Framework - Modely ML s podporou systému jsou podporovány řadou obecných rámců ML v různých jazycích - Apache Mahout, Scikit Learn, Spark ML jsou některé z nich.
Rámce většiny hlubokého učení poskytují vývojářsky přátelskou abstrakci pro snadné vytvoření sítě, starají se o distribuci výpočtů a mají podporu pro GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow jsou široce využívané. nyní s aktivní podporou komunity.

Tabulka s porovnáním s učením vs. hlubokým učením

Níže je uvedeno několik klíčových srovnání mezi supervidovaným učením a hlubokým učením

Základy srovnání mezi supervidovaným učením a hlubokým učením Dozorované učení Hluboké učení
Model školeníHlavní úkoly v oblasti školení -

  • Proměňte se v tréninkových případech, většinou ve formě malých dávek, a aktualizujte závaží aplikovaná na funkce.
  • Směr aktualizace hmotnosti (přírůstek nebo úbytek) určený některými ukazateli, jako je gradient chybové funkce wrt.
  • Nakonec je cíl formulován jako transformace na váženém součtu prvků podmnožiny.
Hlavní úkoly v oblasti školení -

  • Počet závaží, které mají být aktualizovány, je velmi velký, pokud je počet skrytých vrstev více.
  • Chyba v cílové hodnotě vypočtená jako první a rozšířená zpět do každé vrstvy
  • Najděte částečný derivát chybové funkce wrt závaží a aktualizujte závaží, abyste snížili chybu.
Potenciál systémuPoužívá se k řešení relativně jednoduchých úkolů, kde vztah se vstupními vlastnostmi a cíli je detekovatelný člověkem a inženýrství je přímé. Např .:

  • Binomická nebo vícetřídní klasifikace, jako je klasifikace zákazníků na základě jejich interakce s webem.
  • Předpovídejte hodnotu nemovitosti pomocí podobných shromážděných údajů.
Hluboké učení může dělat opravdu inteligentní úkoly jako

  • Klasifikace obrazu téměř na lidské úrovni
  • Rozpoznávání řeči téměř na lidské úrovni
  • Přepis rukopisu téměř na lidské úrovni
  • Vylepšený strojový překlad
  • Digitální asistenti, jako jsou Chytré karty Google a Amazon Alexa
FlexibilitaModely jsou flexibilnější, což pomáhá snadno doladit model ML. Existují dobře definované metody, jako je vyhledávání v mřížce s křížovou validací k nalezení správných hyperparametrůMéně flexibilní, protože existuje mnoho hyperparametrů, které lze vyladit jako počet vrstev, počet neuronů na vrstvu, typ aktivační funkce použité v každé vrstvě, logika inicializace hmotnosti a mnohem více.
Reprezentace funkceOdvozené nebo abstraktní prvky, které mají být vytvořeny explicitně. Například polynomické rysy jako vstup pro lineární regresní modelAbstraktní reprezentace dat automaticky generovaná ve skrytých vrstvách. Proto může trénovaná nervová síť CNN detekovat kočku v obraze.
Generativní modelyNení možné vygenerovat nic originálního, protože nedochází k automatickému zobrazení abstraktních datPo zaškolení může konkrétní typ hluboké neuronové sítě generovat nové obrázky, písničky nebo texty. Tito se nazývají GNN (Generative neuron network) nebo GAN (Generative Adversarial Networks)

Určitá implementace tohoto typu sítě se používá k vytvoření dokonce nových módních návrhů

Závěr - Dozorované učení vs Hluboké učení

Přesnost a schopnost DNN (Deep Neural Networks) se v posledních letech hodně zvýšila. Proto jsou DNN nyní oblastí aktivního výzkumu a věříme, že má potenciál vyvinout obecný inteligentní systém. Současně je obtížné zdůvodnit, proč DNN dává konkrétní výstup, který zjemňuje vyladění sítě. Pokud tedy lze problém vyřešit pomocí jednoduchých modelů ML, důrazně se doporučuje použít tento postup. Díky této skutečnosti bude mít jednoduchá lineární regrese význam, i když je vyvinut inteligentní systém využívající DNN.

Doporučený článek

Toto byl průvodce nejvyššími rozdíly mezi supervidovaným učením a hlubokým učením. Zde diskutujeme také klíčové rozdíly v supervizi učení vs. hluboké učení s infografikou a srovnávací tabulkou. Můžete se také podívat na následující články -

  1. Dozorované učení vs Zesílení učení
  2. Dohledované učení vs Nerušené učení
  3. Neuronové sítě vs hluboké učení
  4. Strojové učení vs prediktivní analýza
  5. TensorFlow vs Caffe: Jaké jsou rozdíly
  6. Co je učení pod dohledem?
  7. Co je to Výztužná výuka?
  8. Top 6 Porovnání mezi CNN vs RNN

Kategorie: