Úvod do architektury strojového učení

Architektura strojového učení jako předmět se v posledních obdobích vyvinula z konceptu fantazie na důkaz skutečnosti.
To, co se vyvinulo ze základního přístupu k rozpoznávání vzorů, je položení základů pro vývoj hlavní platformy umělé inteligence. Základní myšlenkou bylo zjistit, zda jsou stroje schopny se učit z dat, která jim byla poskytnuta, a být schopny produkovat opakovatelné akce s vyšší spolehlivostí a účinným rozhodováním. Můžeme tedy definovat strojové učení jako odvětví umělé inteligence, které trénuje stroje na jak se učit. Schopnost strojového učení umožňuje systému provádět rozhodování bez explicitních vstupů od uživatelů. Tato schopnost je vyvinuta do systému založeného na vzorovém prostoru dat zvaném tréninková data. Využití strojového učení je v dnešní době viditelné v každém technologickém pokroku, ať už jde o jeho schopnost pro mobilní systémy navrhovat volby v aplikacích na základě předchozích vyhledávání uživatele, do nabídky na základě událostí na stránkách restaurací, k přidělování lůžka podle věku, Ve větším kontextu lze strojové učení považovat za aplikaci pro prediktivní analýzu.

Strojové učení může být formálně definováno jako technologie analýzy dat pro znalosti, které mají být extrahovány systémem, bez jakékoli explicitní definice, která bude provádět to na základě řady pozorování.

Typy architektury strojového učení

Architekturu strojového učení lze kategorizovat na základě algoritmu použitého v tréninku.

1. Učení pod dohledem

V učení pod dohledem jsou školená data použitá pro matematický model, který se skládá ze vstupů a požadovaných výstupů. Každý odpovídající vstup má přiřazený výstup, který je také známý jako kontrolní signál. Prostřednictvím dostupné trénovací matice je systém schopen určit vztah mezi vstupem a výstupem a použít je v následných vstupech po tréninku k určení odpovídajícího výstupu. Kontrolované učení lze dále rozšířit na klasifikační a regresní analýzu na základě výstupních kritérií. Klasifikační analýza je prezentována, pokud jsou výstupy omezeny svou povahou a omezeny na soubor hodnot. Regresní analýza však definuje numerický rozsah hodnot pro výstup. Příklady učení pod dohledem jsou vidět v systémech detekce obličeje a ověřování řečníka.

2. Výuka bez dozoru

Na rozdíl od učení pod dohledem, učení bez dozoru používá data školení, která neobsahují výstup. Neupozorněné učení identifikuje vstup relace na základě trendů, společných rysů a výstup je stanoven na základě přítomnosti / absence takových trendů v uživatelském vstupu.

3. Výztužný výcvik

To se používá při tréninku systému k rozhodování o konkrétním kontextu relevance pomocí různých algoritmů k určení správného přístupu v kontextu současného stavu. Ty se široce používají při školení herních portálů, aby podle toho pracovaly na uživatelských vstupech.

Architektura procesu učení stroje

Obr. - Blokové schéma architektury toku rozhodnutí pro systémy strojového učení,

Zkusme nyní porozumět vrstvám znázorněným na obrázku výše.

1. Sběr dat

Protože strojové učení je založeno na dostupných datech pro systém, aby se mohl rozhodnout, prvním krokem definovaným v architektuře je získávání dat. To zahrnuje shromažďování údajů, přípravu a oddělení případových scénářů na základě určitých rysů spojených s rozhodovacím cyklem a předávání údajů zpracovatelské jednotce pro provedení další kategorizace. Tato fáze se někdy nazývá fáze předzpracování dat. Datový model očekává spolehlivá, rychlá a elastická data, která mohou být diskrétní nebo spojitá. Data jsou poté předána do systémů zpracování toku (pro kontinuální data) a uložena v dávkových datových skladech (pro diskrétní data) před tím, než jsou předána do fází modelování nebo zpracování dat.

2. Zpracování dat

Přijatá data ve vrstvě pro získávání dat jsou poté posílána dopředu do vrstvy pro zpracování dat, kde jsou podrobena pokročilé integraci a zpracování a zahrnují normalizaci dat, čištění dat, transformaci a kódování. Zpracování dat závisí také na typu použitého učení. Například, pokud se používá učení pod dohledem, je třeba data rozdělit do několika kroků vzorkovacích dat požadovaných pro výcvik systému a takto vytvořená data se nazývají tréninková vzorová data nebo jednoduše tréninková data. Zpracování dat také závisí na druhu požadovaného zpracování a může zahrnovat volby od akce po kontinuální data, která budou zahrnovat použití specifické architektury založené na funkcích, například architektura lambda. Také to může zahrnovat akci na diskrétní data, která mohou vyžadují zpracování vázané na paměť. Vrstva pro zpracování dat definuje, zda má být zpracování paměti prováděno pro data v tranzitu nebo v klidu.

3. Modelování dat

Tato vrstva architektury zahrnuje výběr různých algoritmů, které by mohly přizpůsobit systém k řešení problému, pro který je učení vyvíjeno. Tyto algoritmy se vyvíjejí nebo jsou zděděny ze sady knihoven. Algoritmy se používají pro modelování dat podle toho, takže systém je připraven k provedení kroku.

4. Poprava

Tato fáze strojového učení je místem, kde se provádí experimentování, provádí se testování a provádí se ladění. Obecným cílem spočívajícím v optimalizaci algoritmu s cílem extrahovat požadovaný výsledek stroje a maximalizovat výkon systému, je výstupem rafinované řešení schopné poskytnout stroji potřebná data, aby se mohl rozhodovat.

5. Nasazení

Stejně jako jakýkoli jiný softwarový výstup musí být ML výstupy provozovány nebo předány pro další průzkumné zpracování. Výstup lze považovat za nedeterministický dotaz, který je třeba dále nasadit do rozhodovacího systému.

Doporučuje se hladce přesouvat výstup ML přímo do výroby, kde to umožní stroji přímo se rozhodovat na základě výstupu a snížit závislost na dalších průzkumných krocích.

Závěry

Architektura strojového učení nyní zaujímá hlavní průmyslový zájem, protože každý proces hledá optimalizaci dostupných zdrojů a výstupů na základě historických dat, která jsou k dispozici, strojové učení navíc zahrnuje hlavní výhody v oblasti predikce dat a prediktivní analýzy ve spojení s technologiemi vědy o datech. Architektura strojového učení definuje různé vrstvy zapojené do cyklu strojového učení a zahrnuje hlavní kroky, které se provádějí při transformaci prvotních dat na tréninkové datové soubory schopné umožnit rozhodování systému.

Doporučené články

Toto byl průvodce architekturou strojového učení. Zde jsme diskutovali o konceptu, procesu a typech architektury strojového učení. Další informace naleznete také v našich dalších doporučených článcích -

  1. Dozorované učení vs Hluboké učení
  2. Co je API v Javě?
  3. Co je architektura HBase?
  4. Co je přetečení vyrovnávací paměti?

Kategorie: