Úvod do strojového učení
Strojové učení (ML) je umění vyvíjející se algoritmy bez výslovného programování. V uplynulých dvou desetiletích byly generovány exabajty dat a většina odvětví byla plně digitalizována. Tato stávající data používají algoritmy Machine Learning (ML) k vývoji prediktivních modelů a automatizaci několika časově náročných úkolů.
Podívejme se, jak se algoritmy ML liší od naprogramovaných algoritmů založených na logice:
U algoritmu založeného na logice je tok dobře definován a známý předem, existuje však několik scénářů reálného života (například klasifikace obrázků), kde nelze definovat logiku. V takových případech se strojové učení ukázalo jako velmi užitečné. Techniky strojového učení berou vstupní parametry a očekávané referenční výstupní data a generují logiku, která je poté nasazena do výroby.
Hlavní součásti úvodu do strojového učení:
Strojové učení je rozděleno do následujících kategorií:
1. Dohled nad strojovým učením
Algoritmus pod dohledem ML bere vstupní data (funkce) spolu s výstupy označenými na vstupu. Většinou se používají pro klasifikační a regresní úkoly.
Klasifikace:
- Rozhodnutí o způsobilosti k půjčce : Automatizujte proces schvalování půjček s využitím minulých údajů, které mají parametry, jako je věk, příjem, vzdělání, město atd., A rozhodněte, zda lze půjčku žadatele schválit.
Regrese:
- Předpověď ceny domu : Předpovídejte cenu domu pomocí funkcí, jako je velikost domu, věk domu, počet pokojů, lokalita atd.
2. Výuka stroje bez dozoru
Techniky ML bez dozoru nevyžadují žádná označená data a používají se pro seskupování dat do různých segmentů na základě vstupních funkcí.
Příklad: Pro rozdělení skupiny 100 lidí do 5 klastrů mohou vstupní prvky zahrnovat zájmy, koníčky, sociální propojení atd.
Aplikace strojového učení
V uplynulém desetiletí se úvodem do strojového učení změnilo několik odvětví, včetně zdravotnictví, sociálních médií, digitálního marketingu, nemovitostí, logistiky, dodavatelského řetězce a výroby. Brzy v těchto odvětvích již dosáhli významných zisků. Roste poptávka po kvalifikované pracovní síle se strojovým učením spolu se znalostmi domény.
Následuje několik aplikací, kde ML techniky hrály významnou roli:
-
Klasifikace nevyžádané pošty:
Klasifikovat poštu jako spam / nevyžádanou poštu pomocí označených odpovědí s použitím dat, jako je obsah zprávy, použití slovní zásoby používané v propagačních e-mailech, e-mailové adrese odesílatele, IP odesílatele, použití hypertextových odkazů, interpunkcí čísel atd.
-
Detekce rakoviny:
ML je stále častěji používán ve zdravotnictví pro diagnostiku a dokonce i pro detekci rakoviny pomocí lékařských dat pro předchozí pacienty. Pro detekci rakoviny prsu bere trénovací algoritmus vstupy, jako je velikost nádoru, poloměr, zakřivení a obvod, jako vstup. Na výstupu máme pravděpodobnost, že nádor je maligní nebo ne.
-
Předpověď prodeje :
Rostoucí počet prodejců digitalizuje své záznamy, mnozí z nich začali používat nástroje strojového učení k předpovídání prodeje konkrétní položky v daném týdnu, aby mohli skladovat dostatečné množství zásob. Úvod Techniky strojového učení by převzaly vstupy z prodeje za předchozí rok pro různé položky a našli vzory pro sezónní variace a poskytly konkrétní předpovědi pro prodej určitých položek. Můžeme také identifikovat položky s nízkou výkonností z hlediska tržeb.
-
Rozpoznávání obličejů:
Pravděpodobně jste při nahrávání obrázků na Facebook zjistili, že značí tváře vašich přátel k jejich jménům. V backend stroji / hlubokém učení algoritmy dělají tuto práci. Stejný základní úvod do principů strojového učení se používá také pro rozpoznávání tváří, kde jsou přiváděny vstupní obrazy obličeje a neuronové sítě jsou trénovány pro klasifikaci těchto obrázků.
-
Klasifikace textu:
S rostoucí populací přicházející online, se stalo pro společnosti z webů / sociálních médií, jako jsou Twitter, Facebook, Quora, povinné zavádět systémy založené na klasifikaci textů. Twitter / Quora to používá k identifikaci nenávistných komentářů / příspěvků. Některé zpravodajské společnosti také používají algoritmy klasifikace textu pro seskupování podobných článků.
-
Interpretace zvuku / hlasu:
Někdy se divíte, jak se zařízení jako Alexa, Siri a Google stávají inteligentními každý den v porozumění zvukových dat v různých jazycích s různými přízvuky. Obrovské množství dat je v těchto zařízeních školeno k seznámení s technikami strojového učení, což umožňuje.
-
Systémy detekce podvodů:
Několik systémů elektronického obchodování využívá systémy detekce podvodů založených na ML, aby identifikovalo zákazníky vytvářející falešné objednávky a také eliminovalo prodejce prodávající padělky na platformě. Bankovní odvětví a další začínající finanční technologie se při detekci podvodných transakcí velmi spoléhají na techniky ML
-
Doporučení Motory
Společnost Netflix používá k doporučování filmů bez dozoru ML, zatímco Amazon ji používá k doporučování produktů k nákupu.
Výhody
-
Automatizujte časově náročné úkoly:
Aplikace založené na ML automatizovaly několik úkolů, jako je rozhodování na nízké úrovni, zadávání dat, tel. Volání, procesy schvalování půjček.
-
Úspora nákladů:
Jakmile je algoritmus vyvinut a uveden do výroby, může způsobit značné úspory nákladů, protože lidská práce a rozhodování jsou minimální.
-
Doba obratu:
Pro mnoho aplikací je celkový čas prvořadý. ML se podařilo zkrátit čas v doménách, jako jsou například nároky na pojištění vozidel, kde uživatel nahrává obrázky a vypočítá se částka pojištění. Pomohlo také společnostem elektronického obchodování při vyřizování výnosů z prodaných zásob.
-
Rozhodování na základě dat:
Nejen podniky, ale mnoho vlád se spoléhá na ML při rozhodování o tom, do kterých projektů investovat a jak optimálně využít stávající zdroje.
Nevýhody
-
Algoritmy ML mohou být zkreslené:
Spousta časů, vstupní data do algoritmu ML je zkreslená na konkrétní pohlaví, rasa, země, kasta atd. To vede k tomu, že algoritmy ML šíří nežádoucí zkreslení do rozhodovacího procesu. To bylo pozorováno v některých aplikacích, které využívaly ML-like přijímací proces školy / vysoké školy a doporučení sociálních médií.
-
Pro dosažení přijatelné přesnosti vyžadují velká data:
Zatímco lidé se mohou snadno učit pro malé datové sady, pro některé aplikace, úvod do strojového učení vyžaduje obrovské množství dat, aby bylo dosaženo dostatečné přesnosti.
-
Manipulovat s rozhodnutím uživatele:
Analytická firma Cambridge Analytica nedávno použila ML algoritmy na sociálních médiích k cílení a ovlivnění rozhodnutí voličů.
-
V současné době může být Úvod do algoritmu strojového učení vhodný do budoucna:
Technika ML trénovaná na aktuálním datovém souboru nemusí být pro budoucnost dobře vhodná, protože distribuce vstupů se může časem významně měnit. Jedním z protiopatření k překonání tohoto je pravidelný trénink modelu.
Doporučené články
Toto byl průvodce Úvodem do strojového učení. Zde jsme diskutovali o strojovém učení se základními body a vlastnostmi úvodu do strojového učení. Můžete se také podívat na následující články:
- Techniky strojového učení
- Strojové učení vs neuronová síť
- Kariéra ve strojovém učení
- Rozdíl mezi stroji Big Data Vs Machine Learning
- Hyperparametrické strojové učení