Úvod do metod strojového učení

Následující článek, Metody strojového učení, poskytuje přehled nejčastěji používaných metod strojového učení. Strojové učení je technika, díky níž počítač dokáže „učit“ věci sám. Algoritmy adaptivně zlepšují jejich výkon, jak rostou data dostupná pro učení. To je čím více dat, tím přesnější bude náš model.

Jak se stroje učí?

Existují různé způsoby, jak toho dosáhnout. Která metoda se má zcela řídit, závisí na prohlášení o problému. V závislosti na souboru údajů a na našem problému existují dva různé způsoby, jak jít hlouběji. Jeden je učení pod dohledem a druhý je učení bez dozoru. Následující tabulka vysvětluje další klasifikaci metod strojového učení. Budeme o nich diskutovat jeden po druhém.

Podívejte se na následující graf!

Pojďme porozumět tomu, co znamená supervidované učení.

Dozorované učení

Jak název napovídá, představte si učitele nebo školitele, který vám pomůže se učit. Totéž platí pro stroje. Stroj trénujeme nebo učíme pomocí dat, která jsou označena.

Některé z nejlepších studijních aplikací pod dohledem jsou:

  • Analýza sentimentu (Twitter, Facebook, Netflix, YouTube atd.)
  • Zpracování přirozeného jazyka
  • Klasifikace obrazu
  • Prediktivní analýza
  • Rozpoznávání vzorů
  • Detekce spamu
  • Zpracování řeči / sekvence

Nyní je učení pod dohledem dále rozděleno do klasifikace a regrese. Pojďme to pochopit.

Klasifikace

Klasifikace je proces nalezení modelu, který pomáhá rozdělit data do různých kategorií. V tomto procesu jsou data roztříděna do různých štítků podle některých parametrů zadaných na vstupu a pak jsou štítky předpovídány pro data. Kategorie znamená, že výstupní proměnná je kategorie, tj. Červená nebo černá, spam nebo ne spam, diabetik nebo nediabetik atd.

Klasifikační modely zahrnují Support vector machine (SVM), K-nejbližší soused (KNN), Naive Bayes atd.

a) Podpora klasifikátoru vektorového stroje (SVM)

SVM je dohlížená metoda učení, která se dívá na data a třídí je do jedné ze dvou kategorií. Pro kategorizaci dat používám hyperplán. Lineární rozlišovací klasifikátor se pokouší nakreslit přímku oddělující dvě sady dat a tím vytvořit model pro klasifikaci. Jednoduše se snaží najít čáru nebo křivku (ve dvou rozměrech) nebo rozdělovač (ve více rozměrech), které oddělují třídy od sebe navzájem.

Poznámka - Pro třídní třídu používá SVM „jeden proti zbytku“, to znamená výpočet různých SVM pro každou třídu.

b) K-nejbližší sousední klasifikátor (KNN)

  • Pokud čtete pozorně, samotný název naznačuje, co algoritmus dělá. KNN považuje datové body, které jsou blíže, jsou mnohem podobnější, pokud jde o vlastnosti, a proto pravděpodobně patří do stejné třídy jako soused. Pro každý nový datový bod se vypočte vzdálenost ke všem ostatním datovým bodům a třída se rozhodne na základě K nejbližších sousedů. Ano, může to znít chromě, ale pro některé klasifikace to funguje jako cokoli.
  • Datový bod je klasifikován podle maximálního počtu hlasů svých sousedů, potom je datový bod přiřazen k třídě nejbližší mezi svými sousedy.
  • V KNN není zapotřebí žádné učení modelu a veškerá práce se děje v době, kdy je požadována predikce. Proto je KNN často označován jako lenivý algoritmus učení.

c) Naïve Bayes klasifikátor

  • Naïve Bayes je algoritmus strojového učení, který je vysoce doporučován pro problémy s klasifikací textu. Je založen na Bayesově teorémě o pravděpodobnosti. Tyto klasifikátory se nazývají naivní, protože předpokládají, že proměnné funkcí jsou na sobě nezávislé. To například znamená, že máme celou větu pro vstup, pak Naïve Bayes předpokládá, že každé slovo ve větě je nezávislé na ostatních slovech. A podle toho je klasifikujte. Vím, že to vypadá docela naivně, ale je to skvělá volba pro problémy s klasifikací textu a je to oblíbená volba pro klasifikaci spamových e-mailů.
  • Poskytuje různé typy algoritmů Naive Bayes jako BernoulliNB, GaussianNB, MultinomialNB.
  • Považuje všechny funkce za nesouvisející, takže se nemůže naučit vztah mezi funkcemi. Například, řekněme, Varun rád jedí hamburgery, rád také francouzské hranolky s koksem. Nelíbí se mu však hamburger a kombinace hranolků s koksem. Zde se Naïve Bayes nemůže naučit vztah mezi dvěma rysy, ale pouze se učí pouze individuální rysové důležitosti.

Nyní pojďme na druhou stranu naší supervidované metody učení, což je regrese.

Regrese

Regrese je proces nalezení modelu, který pomáhá rozlišovat data pomocí kontinuálních hodnot. V tomto je uspořádána povaha předpokládaných dat. Mezi nejpoužívanější regresní modely patří lineární regrese, náhodný les (rozhodovací stromy), neuronové sítě.

Lineární regrese

  • Jeden z nejjednodušších přístupů v učení pod dohledem, což je užitečné při předpovídání kvantitativní odpovědi.
  • Lineární regrese zahrnuje nalezení nejvhodnější přímky přes body. Nejvhodnější linie se nazývá regresní linie. Nejvhodnější čára neprochází přesně všemi datovými body, ale místo toho se snaží přiblížit se jim.
  • Je to široce používaný algoritmus pro kontinuální data. Zaměřuje se však pouze na průměr závislé proměnné a omezuje se na lineární vztah.
  • Lineární regrese lze použít pro časové řady, predikce trendů. Na základě předchozích údajů může předpovídat budoucí prodej.

Bez dozoru

  • Neupozorněné učení je založeno na přístupu, který lze považovat za nepřítomnost učitele, a tedy z absolutních chybových opatření. Je užitečné, když je třeba se naučit seskupování nebo seskupování prvků. Prvky mohou být seskupeny (seskupeny) podle jejich podobnosti.
  • V učení bez dozoru jsou data neoznačená, nekategorizovaná a algoritmy systému na data působí bez předchozího školení. Neupozorované algoritmy učení mohou provádět složitější úkoly než kontrolované algoritmy učení.
  • Neupozorněné učení zahrnuje klastrování, které lze provést pomocí K znamená klastrování, hierarchické, gaussovské směsi, skrytý Markovův model.

Aplikace bez dozoru jsou:

  1. Detekce podobnosti
  2. Automatické označování
  3. Segmentace objektů (např. Osoba, zvíře, filmy)

Shlukování

  • Clustering je technika bez dozoru, která se používá pro analytiku dat v mnoha oborech. Algoritmus klastrování se hodí, když chceme získat podrobné informace o našich datech.
  • Příkladem shlukování v reálném světě by byly žánrové klastry Netflixu, které jsou rozděleny pro různé cílové zákazníky, včetně zájmů, demografie, životního stylu atd. Nyní můžete přemýšlet o tom, jak užitečné je klastrování, když společnosti chtějí porozumět své zákaznické základně a zacílit na nový potenciál. zákazníky.

a) K znamená shlukování

  • K znamená, že shlukovací algoritmus se snaží rozdělit daná neznámá data do klastrů. Náhodně vybere 'k' klastry centroidů, vypočítá vzdálenost mezi datovými body a klastry centroidů a nakonec přidělí datový bod klastrové centroidi, jejíž vzdálenost je minimální ze všech centroidů klastrů.
  • V k-znamená, skupiny jsou definovány nejbližší těžiště pro každou skupinu. Tento centroid funguje jako „mozek“ algoritmu, získává datové body, které jsou mu nejblíže, a poté je přidává do shluků.

b) Hierarchické shlukování

Hierarchické klastrování je téměř podobné hierarchickému klastrování, pokud si nepřejete vytvořit hierarchii klastrů. To se může hodit, když se rozhodnete pro počet klastrů. Předpokládejme například, že vytváříte skupiny různých položek v internetovém obchodě s potravinami. Na úvodní domovské stránce chcete několik širokých položek a jakmile kliknete na jednu z položek, konkrétní kategorie, které jsou konkrétnější klastry, otevře se.

Zmenšení rozměrů

Zmenšení rozměrů lze považovat za komprimaci souboru. To znamená, že se odstraní informace, které nejsou relevantní. To snižuje složitost dat a snaží se uchovávat smysluplná data. Například při kompresi obrazu omezujeme rozměrnost prostoru, ve kterém obraz zůstává, tak, jak je, aniž by se zničilo příliš mnoho smysluplného obsahu v obrazu.

PCA pro vizualizaci dat

Analýza hlavních komponent (PCA) je metoda redukce rozměrů, která může být užitečná pro vizualizaci vašich dat. PCA se používá ke kompresi dat vyšší dimenze na data nižší dimenze, to znamená, že můžeme použít PCA pro redukci čtyřrozměrných dat na trojrozměrné nebo 2 dimenze, abychom mohli vizualizovat a lépe porozumět datům.

Doporučené články

Toto je průvodce metodami strojového učení. Zde jsme probrali úvod, jak se stroje učí? klasifikace strojového učení a vývojový diagram spolu s podrobným vysvětlením. Další informace naleznete také v dalších navrhovaných článcích -

  1. Architektura strojového učení
  2. Rámce strojového učení
  3. Nástroje strojového učení
  4. Techniky strojového učení
  5. Hyperparametrické strojové učení
  6. Hierarchický klastrovací algoritmus
  7. Hierarchické klastry Aglomerativní a dělící se shlukování

Kategorie: