Úvod do učení pod dohledem a učení bez dozoru

Dozorované učení a učení bez dozoru jsou úkoly strojového učení.
Dozorované učení je jednoduše proces algoritmu učení z datového souboru školení. Kontrolované učení je místo, kde máte vstupní proměnné a výstupní proměnné a pomocí algoritmu se naučíte mapovací funkci od vstupu do výstupu. Cílem je aproximovat funkci mapování tak, že když máme nová vstupní data, můžeme předpovědět výstupní proměnné pro tato data.

Neupozorované učení je modelování základní nebo skryté struktury nebo distribuce v datech, aby se o datech dozvěděli více. Neupozorované učení je místo, kde máte pouze vstupní data a žádné odpovídající výstupní proměnné.

Dataset školení: Soubor příkladů používaných pro učení, kde je známa cílová hodnota.

Srovnávání mezi hlavami mezi supervidovaným učením a nedohledávaným učením (infografika)

Níže je top 7 srovnání mezi supervidovaným učením a nedohledávaným učením

Klíčové rozdíly mezi učením pod dohledem a učením bez dozoru

Níže jsou uvedeny seznamy bodů, které popisují klíčové rozdíly mezi učením pod dohledem a učením bez dozoru

1. Algoritmy strojového učení objevují vzory ve velkých datech. Tyto různé algoritmy lze rozdělit do dvou kategorií na základě způsobu, jakým se „naučí“ o datech, aby vytvořily předpovědi. Jsou to učení pod dohledem a bez dozoru.

2. V rámci učení se vědec chová jako průvodce, jak naučit algoritmus, s jakými závěry nebo předpovědi by měl přijít. V učení bez dozoru neexistuje správná odpověď, neexistuje učitel, algoritmy jsou ponechány na jejich vlastním objevování a prezentování zajímavé skryté struktury v datech.

3. Model dozoru, který je pod dohledem, využije tréninkových údajů k získání vazby mezi vstupem a výstupy.

4. Neupozorněné učení nepoužívá výstupní data. V učení bez dozoru nebudou jejich „žádné předchozí známé znalosti“, zatímco v kontrolovaném učení budou mít přístup k štítkům a budou mít předchozí znalosti o souborech údajů

5. Dozorované učení: Myšlenkou je, že školení lze zobecnit a že model lze s určitými přesnostmi použít na nová data.

6. Dohledané algoritmy učení: Podpora vektorového stroje, lineární a logistická regrese, neuronová síť, klasifikační stromy a náhodný les atd.

7. Neupozorované algoritmy lze rozdělit do různých kategorií: klastrové algoritmy, K-prostředky, hierarchické shlukování, algoritmy dimenzionální redukce, detekce anomálií atd.

8. Klasifikační a regresní oblast široce používané algoritmy ve supervizovaném učení. Podporované vektorové stroje (SVM) jsou dohlížecí modely strojového učení s přidruženými algoritmy učení, které lze použít jak pro účely klasifikace, tak pro regresi, ale většinou se používají pro problémy klasifikace.

9. V modelu SVM vykreslujeme každou datovou položku jako bod v n-dimenzionálním prostoru (kde n je funkce, které máme), přičemž hodnoty každého prvku jsou hodnotou konkrétní souřadnice. Poté byla klasifikace provedena nalezením hyperplánu, který rozlišuje tyto dvě třídy.

10. Hlavním cílem regresních algoritmů je předpovědět diskrétní nebo pokračující hodnotu. V některých případech lze predikovanou hodnotu použít k identifikaci lineárního vztahu mezi atributy. Na základě problému lze použít regresní algoritmy. Některé ze základních regresních algoritmů jsou lineární regrese, polynomiální regrese atd.

11. Clustering je široce používán v učení bez dozoru. Clustering je úkol rozdělit datové body do počtu skupin tak, aby stejné znaky byly společně ve formě shluku. Existuje více algoritmů shlukování; několik z nich jsou modely konektivity, modely centroidů, distribuční modely a modely hustoty.

12.Hierarchické seskupování spadá pod učení bez dozoru. Hierarchické shlukování, jak název napovídá, je algoritmus, který vytváří hierarchii shluků. Tento algoritmus začíná u všech datových bodů přiřazených k jejich vlastnímu clusteru. Poté jsou dva nejbližší klastry sloučeny do stejného klastru. Nakonec se tento algoritmus ukončí, když zbude pouze jeden klastr.

13.Kmeans spadají pod metodu shlukování bez dozoru. Data budou rozdělena do klastrů k na základě jejich funkcí. Každý klastr je reprezentován svou těžiště, definovanou jako střed bodů v klastru. KMeans je jednoduchý a rychlý, ale při každém běhu nepřináší stejný výsledek.

14. Abychom lépe porozuměli učení pod dohledem a učení bez dozoru, vezměme si příklady ze skutečného života. Dozorované učení: Jako příklad si vezměme jednu z funkcí Gmailu, kterou je spam. Na základě minulých informací o nevyžádaných e-mailech odfiltruje nový příchozí e-mail do složky Doručená pošta nebo Nevyžádaná pošta. V tomto scénáři je služba Gmail modelována jako funkce mapování k oddělení příchozí pošty na základě předchozích znalostí o e-mailech.

15. Nepodporované učení: Předpokládejme, že vás přítel pozve na její párty, kde potkáte nové lidi. Nyní je zařadíte bez předchozí znalosti (učení bez dozoru) a tato klasifikace může být na libovolném znaku. Mohlo by to být věková skupina, pohlaví, oblékání, vzdělání nebo jakýkoli způsob, jakým byste chtěli. Protože jste nepoužívali žádné předchozí znalosti o lidech a klasifikovali je, spadá to do učení bez dozoru.

Tabulka s porovnáním pod dohledem vs tabulka s porovnáváním bez dozoru

Dozorované učeníBez dozoru

Metoda

Budou zadány vstupní a výstupní proměnné.Budou zadána pouze vstupní data

Fotbalová branka

Cílem supervidovaného učení je určit funkci tak dobře, že když je dána nová sada vstupních dat, může předpovědět výstup.Cílem sledování bez dozoru je modelovat skryté vzorce nebo základní strukturu v zadaných vstupních datech, aby se o datech dozvěděli.

Třída

Problémy strojového učení, dolování dat a neuronové sítě,Strojové učení, dolování dat, problémy a neuronová síť

Příklady

  • Klasifikace
  • Regrese
  • Lineární regrese
  • Podpora vektor stroj
  • Shlukování
  • Sdružení
  • k-znamená
  • Sdružení
Kdo používáVědci datVědci dat

Ekosystémy

Zpracování velkých dat, dolování dat atd

Zpracování velkých dat, dolování dat atd

Použití

Dozorované učení se často používá pro exportní systémy v rozpoznávání obrazu, rozpoznávání řeči, předpovídání, finanční analýze a školení neuronových sítí a rozhodovacích stromů atd.

Neupozorované algoritmy učení se používají k předběžnému zpracování dat, během průzkumné analýzy nebo k předběžnému zaškolení algoritmů učení.

Závěr - učení pod dohledem vs učení bez dozoru

Výběr použití algoritmu strojového učení pod dohledem nebo bez dozoru obvykle závisí na faktorech souvisejících se strukturou a objemem vašich dat a případem použití. Ve skutečnosti ve většině případů vědci s údaji používají k vyřešení případu použití přístupy Supervised Learning i Unsupervised Learning.

Doporučený článek

Toto byl průvodce supervidovaným učením vs nedohledávaným učením, jejich významem, srovnáváním typu hlava-hlava, klíčovými rozdíly, srovnávací tabulkou a závěrem. Další informace naleznete také v následujících článcích -

  1. Nejlepší 7 srovnání mezi supervidovaným učením a posilováním učení
  2. 5 nejužitečnější rozdíl mezi datovou vědou a strojovým učením
  3. Naučte se 10 nejlepších rozdílů mezi mapami Snížení vs Příze
  4. MapReduce vs Apache Spark-20 Užitečné srovnání, které je třeba se naučit
  5. Co je to Výztužná výuka?

Kategorie: