Úvod do jaderných metod

Jádra nebo metody jádra (nazývané také funkce jádra) jsou sady různých typů algoritmů, které se používají pro analýzu vzorů. Používají se k řešení nelineárního problému pomocí lineárního klasifikátoru. Metody jádra se používají v SVM (Support Vector Machines), které se používají při klasifikačních a regresních problémech. SVM používá tzv. „Kernel Trick“, kde jsou data transformována a je nalezena optimální hranice pro možné výstupy.

Potřeba metody jádra a její práce

Než se pustíme do práce s jádrovými metodami, je důležitější porozumět podpůrným vektorovým strojům nebo SVM, protože jádra jsou implementována do modelů SVM. Podporované vektorové stroje jsou tedy pod dohledem algoritmů strojového učení, které se používají při klasifikačních a regresních problémech, jako je klasifikace jablek na ovoce třídy a klasifikace lva na zvíře třídy.

Pro demonstraci níže je, jak vypadají podporované vektorové stroje:

Zde vidíme hyperplán, který odděluje zelené tečky od modrých. Hyperplán je o jeden rozměr menší než okolní rovina. Např. Na obrázku nahoře máme 2 dimenzi, která reprezentuje okolní prostor, ale osamělý, který rozděluje nebo klasifikuje prostor, je o jeden rozměr menší než okolní prostor a nazývá se hyperplane.

Ale co když budeme mít takové vstupy:

Je velmi obtížné vyřešit tuto klasifikaci pomocí lineárního klasifikátoru, protože neexistuje žádná dobrá lineární linie, která by měla být schopna klasifikovat červené a zelené tečky, protože body jsou náhodně rozděleny. Zde přichází použití funkce jádra, která vede body do vyšších dimenzí, řeší problém tam a vrací výstup. Přemýšlejte o tom tímto způsobem, můžeme vidět, že zelené tečky jsou uzavřeny v nějaké obvodové oblasti, zatímco červená leží mimo ni, podobně by mohly existovat další scénáře, kde by zelené tečky mohly být distribuovány v oblasti lichoběžníkového tvaru.

Takže to, co děláme, je převést dvourozměrnou rovinu, která byla nejprve klasifikována jednorozměrnou hyperlinkou („nebo přímkou“), na trojrozměrnou oblast a zde náš klasifikátor, tj. Hyperplán nebude přímá, ale dvojitá -rozměrná rovina, která ořízne oblast.

Abychom získali matematické porozumění jádra, pochopme Lili Jiangovu rovnici jádra, která je:

K (x, y) = kde,
K je funkce jádra,
X a Y jsou rozměrové vstupy,
f je mapa z n-rozměrného do m-rozměrného prostoru a
je tečkový produkt.

Ilustrace pomocí příkladu.

Řekněme, že máme dva body, x = (2, 3, 4) a y = (3, 4, 5)

Jak jsme viděli, K (x, y) =.

Pojďme nejprve spočítat

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
tak,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) a
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
tečkový produkt,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 + 144 + 240 + 120 + 240 + 400) =
1444
A,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Jak zjistíme, f (x) .f (y) a K (x, y) nám poskytnou stejný výsledek, ale předchozí metoda vyžadovala spoustu výpočtů (kvůli promítnutí 3 rozměrů do 9 rozměrů) při použití jádro, bylo to mnohem snazší.

Druhy jádra a metody v SVM

Podívejme se na některé funkce jádra nebo typy používané v SVM:

1. Linerové jádro - řekněme, že máme dva vektory s názvem x1 a Y1, pak je lineární jádro definováno tečkovým součinem těchto dvou vektorů:

K (x1, x2) = x1. x2

2. Polynomiální jádro - Polynomiální jádro je definováno následující rovnicí:

K (x1, x2) = (x1. X2 + 1) d,

Kde,

d je stupeň polynomu a x1 a x2 jsou vektory

3. Gaussovo jádro - Toto jádro je příkladem jádra s radiální základní funkcí. Níže je uvedena rovnice:

Daný sigma hraje velmi důležitou roli při výkonu gaussovského jádra a neměl by být ani podceňován ani podceňován, měl by být pečlivě vyladěn podle problému.

4. Exponenciální jádro - Toto je v těsném vztahu k předchozímu jádru, tj. Gaussovo jádro s jediným rozdílem - čtverec normy je odstraněn.

Funkce exponenciální funkce je:


Toto je také funkce jádra s radiálním základem.

5. Laplacianské jádro - Tento typ jádra je méně náchylný ke změnám a je zcela stejný jako dříve diskutované jádro exponenciálních funkcí, rovnice Laplacianského jádra je dána jako:

6. Hyperbolické nebo sigmoidní jádro - Toto jádro se používá v neuronových sítích strojového učení. Aktivační funkce sigmoidního jádra je bipolární sigmoidní funkce. Rovnice pro funkci hyperbolického jádra je:

Toto jádro je mezi podporovanými vektorovými stroji velmi rozšířené a oblíbené.

7. Anova radiální jádro - Je známo, že toto jádro funguje velmi dobře v multidimenzionálních regresních problémech, jako jsou jádra Gaussova a Laplacianského jádra. To také spadá do kategorie jádra s radiálním základem.

Rovnice pro jádro Anova je:

Existuje mnohem více typů metody jádra a diskutovali jsme o nejčastěji používaných jádrech. Závisí to čistě na typu problému, který rozhodne o použití jádra.

Závěr

V této sekci jsme viděli definici jádra a jak to funguje. Pokusili jsme se vysvětlit pomocí diagramů fungování jader. Poté jsme se pokusili poskytnout jednoduchou ilustraci pomocí matematiky o funkci jádra. V poslední části jsme viděli různé typy funkcí jádra, které se dnes běžně používají.

Doporučené články

Toto je průvodce metodami jádra. Zde diskutujeme úvod, potřebu, práci a typy jaderných metod s odpovídající rovnicí. Další informace naleznete také v dalších navrhovaných článcích -

  1. Algoritmy dolování dat
  2. K- Znamená Clustering Algorithm
  3. Algoritmus hrubé síly
  4. Algoritmus rozhodovacího stromu
  5. Metody jádra ve strojovém učení
  6. Rozhodovací strom ve strojovém učení

Kategorie: