Úvod do jaderných metod ve strojovém učení

Algoritmus používaný pro analýzu vzorů se v strojovém učení nazývá jádrovou metodou. Obecně se provádí analýza za účelem nalezení vztahů v souborech dat. Tyto vztahy mohou být shlukování, klasifikace, hlavní komponenty, korelace atd. Většina z těchto algoritmů, které řeší tyto úkoly analýzy vzoru, potřebují data v nezpracovaném zástupci, aby byla explicitně transformována do reprezentace vektoru funkcí. Tuto transformaci lze provést pomocí uživatelsky definované mapy funkcí. Lze tedy vzít v úvahu, že metoda jádra vyžaduje pouze jádro zadané uživatelem.

Terminologie Kernal Method vychází ze skutečnosti, že používají funkci jádra, což jim umožňuje provádět operace ve vysokorozměrném implicitním prostoru funkcí bez nutnosti výpočtu souřadnic dat v tomto prostoru. Místo toho jednoduše vypočítají vnitřní produkt mezi obrazy všech párů dat v prostoru prvků.

Tyto operace jsou po většinu času výpočetně levnější ve srovnání s explicitním výpočtem souřadnic. Tato technika se nazývá „trik jádra“. Jakýkoli lineární model lze převést na nelineární model použitím jádra triku na model.

Metoda jádra dostupná v strojovém učení je analýza hlavních komponent (PCA), spektrální shlukování, stroje podporujících vektorů (SVM), kanonická korelační analýza, perceptron jádra, gaussovské procesy, regrese hřebene, lineární adaptivní filtry a mnoho dalších. Pojďme se seznámit s několika z těchto metod jádra na vysoké úrovni.

Top 7 metod jádra ve strojovém učení

Níže jsou uvedeny metody jádra ve strojovém učení:

1. Základní analýza komponent

Analýza hlavních komponent (PCA) je technika pro extrakci struktury z možná vysokorozměrných datových souborů. To se snadno provádí pomocí iteračních algoritmů, které odhadují hlavní komponenty nebo řešením problému vlastní hodnoty. PCA je ortogonální transformace souřadného systému, ve kterém popisujeme naše data. Nový souřadnicový systém je získán projekcí na hlavní osy dat. Malý počet hlavních složek často postačuje k tomu, aby zohlednil většinu struktury v datech. Jednou z hlavních aplikací je provedení průzkumné analýzy dat pro vytvoření prediktivního modelu. Většinou se to používalo k vizualizaci vztahu mezi populacemi a genetickou vzdáleností.

2. Podpora Vector Machine

SVM lze definovat jako klasifikátor pro oddělování hyperjadra, kde hyperplane je subprostor o jednu dimenzi menší než okolní prostor. Rozměr tohoto matematického prostoru je definován jako minimální počet souřadnic požadovaných pro určení libovolného bodu, zatímco okolní prostor je prostor, který obklopuje matematický objekt. Matematický objekt lze nyní chápat jako abstraktní objekt, který neexistuje v žádném okamžiku ani na jiném místě, ale existuje jako typ věci.

3. Gaussův proces

Gaussovský proces byl pojmenován po Carkovi Friedrichovi Gaussovi, protože používá zápis Gaussovy distribuce (normální distribuce). Je to stochastický proces, který znamená soubor náhodných proměnných indexovaných podle času nebo prostoru. V Gaussově procesu mají náhodné proměnné vícerozměrné normální rozdělení, tj. Všechny konečné lineární kombinace jsou normálně distribuovány. Gaussovský proces používá vlastnosti zděděné z normální distribuce, a proto jsou užitečné ve statistickém modelování. Algoritmus strojového učení, který zahrnuje tuto metodu jádra, používá míru líného učení a podobnost mezi body k predikci hodnoty neviditelných bodů z tréninkových dat. Tato predikce není pouze odhadem, ale nejistotou v tomto bodě.

4. Kanonická korelační analýza

Kanonická korelační analýza je způsob, jak odvodit informace z matic křížové kovariance. Je také znám jako analýza kanonických variací. Předpokládejme, že máme dva vektory X, Y náhodné proměnné, říkají dva vektory X = (X1, …, Xn) a vektor Y = (Y1, …, Ym), a proměnná, která má korelaci, pak CCA vypočítá lineární kombinaci X a Y, které mají mezi sebou maximální korelaci.

5. Spektrální shlukování

V aplikaci segmentace obrazu je spektrální shlukování známé jako kategorizace objektů založená na segmentaci. Ve Spectral Clustering se redukce dimenze provádí před klastrováním v menší dimenzi, to se provádí pomocí vlastní hodnoty matice podobnosti dat. Má své kořeny v teorii grafů, kde se tento přístup používá k identifikaci společenství uzlů v grafu, který je založen na hranách, které je spojují. Tato metoda je dostatečně flexibilní a umožňuje nám také seskupovat data z negrafu.

6. Adaptivní filtr

Adaptivní filtr používá lineární filtr, který obsahuje přenosovou funkci, která je řízena proměnnými parametry a způsoby, které budou použity k vyladění těchto parametrů podle optimalizačního algoritmu. Složitost tohoto optimalizačního algoritmu je příčinou toho, že veškerý adaptivní filtr je digitální filtr. Adaptivní filtr je nutný v těch aplikacích, kde neexistují žádné předchozí informace o požadované operaci zpracování předem nebo se mění.

Nákladová funkce se používá v adaptivním filtru s uzavřenou smyčkou, protože je to nezbytné pro optimální výkon filtru. Určuje, jak upravit funkci přenosu filtru, aby se snížily náklady na další iteraci. Jednou z nejčastějších funkcí je střední chyba chyby chybového signálu.

7. Kernel Perceptron

Ve strojovém učení je jádro perceptron typem populárního algoritmu učení perceptronu, který se může učit stroje jádra, jako jsou nelineární klasifikátory, které používají funkci jádra pro výpočet podobnosti těch vzorků, které nejsou vidět na výcvikových vzorcích. Tento algoritmus byl vynalezen v roce 1964 a stal se tak prvním studentem klasifikace jádra.

Většina diskutovaných algoritmů jádra je založena na konvexní optimalizaci nebo vlastních problémech a je statisticky opodstatněná. Jejich statistické vlastnosti jsou analyzovány pomocí statistické teorie učení.

Když mluvíme o aplikačních oblastech jaderných metod, je to rozmanité a zahrnuje geostatistiku, kriging, inverzní vážení vzdáleností, 3D rekonstrukci, bioinformatiku, chemoinformatiku, extrakci informací a rozpoznávání rukopisu.

Závěr

Shrnul jsem některé terminologie a typy metod jádra ve strojovém učení. Vzhledem k nedostatku místa není tento článek v žádném případě vyčerpávající a je určen pouze k tomu, abyste porozuměli tomu, co je jádro a stručné shrnutí jejich typů. Avšak pokrytí tohoto článku vás učiní prvním krokem v oblasti strojového učení.

Doporučené články

Toto je průvodce metodou jádra ve strojovém učení. Zde diskutujeme 7 typů jaderných metod ve strojovém učení. Můžete se také podívat na následující článek.

  1. Monolitické jádro
  2. Shlukování ve strojovém učení
  3. Data Science Machine Learning
  4. Strojové učení bez dozoru
  5. PHP filtry | Jak ověřit vstup uživatele pomocí různých filtrů?
  6. Kompletní průvodce životním cyklem strojového učení

Kategorie: