Úvod do klasifikace neuronové sítě

Neuronové sítě jsou nejúčinnějším způsobem (ano, čtete to správně) k řešení skutečných problémů v umělé inteligenci. V současné době je také jednou z rozsáhle zkoumaných oblastí v oblasti informatiky, že by se při čtení tohoto článku vyvinula nová forma neuronové sítě. Existují stovky neuronových sítí, které řeší problémy specifické pro různé domény. Zde vás provedeme různými typy základních neuronových sítí v pořadí podle rostoucí složitosti.

Různé typy základů při klasifikaci neuronových sítí

1. Mělké neuronové sítě (kolaborativní filtrování)

Neuronové sítě jsou tvořeny skupinami Perceptronu pro simulaci neurální struktury lidského mozku. Mělké neuronové sítě mají jednu skrytou vrstvu perceptronu. Jedním z běžných příkladů mělkých neuronových sítí je kolaborativní filtrování. Skrytá vrstva perceptronu by byla vyškolena, aby reprezentovala podobnosti mezi entitami, aby generovala doporučení. Systém doporučení v Netflixu, Amazonu, YouTube atd. Používá k doporučování svých produktů verzi zájmového filtrování podle zájmu uživatele.

2. Vícevrstvý perceptron (hluboké neurální sítě)

Neuronové sítě s více než jednou skrytou vrstvou se nazývají hluboké neuronové sítě. Varování: spoiler! Všechny následující neuronové sítě jsou formou hluboké neuronové sítě vyladěné / vylepšené pro řešení problémů specifických pro danou doménu. Obecně nám pomáhají dosáhnout univerzality. Při dostatečném počtu skrytých vrstev neuronu se hluboká neuronová síť může přiblížit, tj. Vyřešit jakýkoli složitý problém v reálném světě.

Univerzální aproximační věta je jádrem hlubokých neuronových sítí pro trénink a přizpůsobení jakéhokoli modelu. Každá verze hluboké neuronové sítě je vyvinuta plně spojenou vrstvou maximálního sdruženého produktu násobení matic, který je optimalizován algoritmy backpropagation. Budeme se nadále učit vylepšení vedoucím k různým formám hlubokých neuronových sítí.

3. Konvoluční neuronová síť (CNN)

CNN jsou nejvyspělejší formou hlubokých neuronových sítí, které produkují nejpřesnější, tj. Lepší než lidské výsledky v počítačovém vidění. CNN jsou vyrobeny z vrstev Convolutions vytvořených skenováním každého pixelu obrázků v datové sadě. Jakmile data získají přibližnou vrstvu po vrstvě, CNN začne rozpoznávat vzory a tím rozpoznávat objekty v obrazech. Tyto objekty jsou široce používány v různých aplikacích pro identifikaci, klasifikaci atd. Nedávné postupy, jako je učení přenosu v CNN, vedly k významnému zlepšení nepřesnosti modelů. Google Translator a Google Lens jsou nejmodernějším příkladem CNN.

Aplikace CNN je exponenciální, protože se dokonce používají při řešení problémů, které se primárně netýkají počítačového vidění. Zde naleznete velmi jednoduché, ale intuitivní vysvětlení CNN.

4. Rekurentní neuronová síť (RNN)

RNN jsou nejnovější formou hlubokých neuronových sítí pro řešení problémů v NLP. Jednoduše řečeno, RNN posílají výstup několika skrytých vrstev zpět do vstupní vrstvy, aby se agregovaly a přenesly aproximaci k další iteraci (epochě) vstupního datového souboru. Pomáhá také modelu se naučit a korigovat předpovědi do určité míry rychleji. Takové modely jsou velmi užitečné při pochopení sémantiky textu v operacích NLP. Existují různé varianty RNN, jako je Long Short Term Memory (LSTM), Gated Recurrent Unit (GRU), atd. V níže uvedeném diagramu je aktivace z h1 a h2 napájena vstupem x2 a x3.

5. Dlouhá krátkodobá paměť (LSTM)

LSTM jsou navrženy speciálně pro řešení problému mizejících gradientů s RNN. Mizející přechody se vyskytují u velkých neuronových sítí, kde gradienty ztrátových funkcí mají tendenci se přibližovat k nule, takže se pozastavují neuronové sítě, aby se učily. LSTM řeší tento problém tím, že brání aktivačním funkcím v rámci svých opakujících se komponent a tím, že uložené hodnoty nezmutují. Tato malá změna přinesla velká vylepšení v konečném modelu, což vedlo k tomu, že techničtí giganti přizpůsobili LSTM ve svých řešeních. Přes „nejjednodušší samovysvětlující“ ilustraci LSTM,

6. Pozornost sítě

Modely pozornosti v praxi pomalu přebírají i nové RNN. Modely Attention jsou vytvořeny zaměřením na část podmnožiny informací, které jsou poskytovány, čímž se eliminuje ohromné ​​množství informací o pozadí, které nejsou potřebné pro daný úkol. Modely pozornosti jsou konstruovány s kombinací měkké a tvrdé pozornosti a přiléhavého šíření měkké pozornosti. Více hierarchicky uspořádaných modelů pozornosti se nazývá transformátor. Tyto transformátory jsou efektivnější pro paralelní provoz komínů, takže produkují nejmodernější výsledky s relativně menšími daty a časem na zaškolení modelu. Při použití s ​​CNN / RNN je distribuce pozornosti velmi výkonná a může následovně vytvořit obrazový popis obrázku.

Tech giganti jako Google, Facebook atd. Rychle přizpůsobují modely pozornosti pro vytváření svých řešení.

7. Generativní protivníková síť (GAN)

Ačkoli modely hlubokého učení poskytují nejmodernější výsledky, lze je oklamat mnohem inteligentnějšími lidskými protějšky přidáním šumu do skutečných dat. GAN jsou nejnovějším vývojem v oblasti hlubokého učení, které řeší takové scénáře. GAN používají učení bez dozoru, kde hluboké neuronové sítě trénovaly s daty generovanými AI modelem spolu se skutečným datovým souborem ke zlepšení přesnosti a efektivity modelu. Tato kontradiktorní data se většinou používají k oklamání diskriminačního modelu za účelem vytvoření optimálního modelu. Výsledný model má sklon být lepší aproximací, než může takový šum překonat. Zájem o výzkum v GAN vedl k sofistikovanějším implementacím, jako jsou podmíněné GAN (CGAN), Laplacian Pyramid GAN (LAPGAN), Super Resolution GAN (SRGAN) atd.

Závěr - Klasifikace neuronové sítě

Hluboké neuronové sítě tlačily hranice počítačů. Nejsou omezeny pouze na klasifikaci (CNN, RNN) nebo předpovědi (kolaborativní filtrování), ale i na generování dat (GAN). Tato data se mohou lišit od krásné formy umění po kontroverzní Deep fake, přesto každý den překonávají člověka úkolem. Proto bychom také měli zvážit etiku AI a dopady AI při tvrdé práci na vybudování efektivního modelu neuronové sítě. Čas na úhledný infographic o neuronových sítích.

Doporučené články

Toto je průvodce klasifikací neuronové sítě. Zde jsme diskutovali různé typy základních neuronových sítí. Další informace naleznete také v našich článcích.

  1. Co je to neuronové sítě?
  2. Algoritmy neuronových sítí
  3. Nástroje síťového skenování
  4. Rekurentní neuronové sítě (RNN)
  5. Top 6 Porovnání mezi CNN vs RNN

Kategorie: