Úvod do strojového učení

Strojové učení (ML) je umění vyvíjející se algoritmy bez výslovného programování. V uplynulých dvou desetiletích byly generovány exabajty dat a většina odvětví byla plně digitalizována. Tato stávající data používají algoritmy Machine Learning (ML) k vývoji prediktivních modelů a automatizaci několika časově náročných úkolů.

Podívejme se, jak se algoritmy ML liší od naprogramovaných algoritmů založených na logice:

U algoritmu založeného na logice je tok dobře definován a známý předem, existuje však několik scénářů reálného života (například klasifikace obrázků), kde nelze definovat logiku. V takových případech se strojové učení ukázalo jako velmi užitečné. Techniky strojového učení berou vstupní parametry a očekávané referenční výstupní data a generují logiku, která je poté nasazena do výroby.

Hlavní součásti úvodu do strojového učení:

Strojové učení je rozděleno do následujících kategorií:

1. Dohled nad strojovým učením

Algoritmus pod dohledem ML bere vstupní data (funkce) spolu s výstupy označenými na vstupu. Většinou se používají pro klasifikační a regresní úkoly.

Klasifikace:

Rozhodnutí o způsobilosti k půjčce : Automatizujte proces schvalování půjček s využitím minulých údajů, které mají parametry, jako je věk, příjem, vzdělání, město atd., A rozhodněte, zda lze půjčku žadatele schválit.

Regrese:

Předpověď ceny domu : Předpovídejte cenu domu pomocí funkcí, jako je velikost domu, věk domu, počet pokojů, lokalita atd.

2. Výuka stroje bez dozoru

Techniky ML bez dozoru nevyžadují žádná označená data a používají se pro seskupování dat do různých segmentů na základě vstupních funkcí.

Příklad: Pro rozdělení skupiny 100 lidí do 5 klastrů mohou vstupní prvky zahrnovat zájmy, koníčky, sociální propojení atd.

Aplikace strojového učení

V uplynulém desetiletí se úvodem do strojového učení změnilo několik odvětví, včetně zdravotnictví, sociálních médií, digitálního marketingu, nemovitostí, logistiky, dodavatelského řetězce a výroby. Brzy v těchto odvětvích již dosáhli významných zisků. Roste poptávka po kvalifikované pracovní síle se strojovým učením spolu se znalostmi domény.

Následuje několik aplikací, kde ML techniky hrály významnou roli:

Klasifikace nevyžádané pošty:

Klasifikovat poštu jako spam / nevyžádanou poštu pomocí označených odpovědí s použitím dat, jako je obsah zprávy, použití slovní zásoby používané v propagačních e-mailech, e-mailové adrese odesílatele, IP odesílatele, použití hypertextových odkazů, interpunkcí čísel atd.

Detekce rakoviny:

ML je stále častěji používán ve zdravotnictví pro diagnostiku a dokonce i pro detekci rakoviny pomocí lékařských dat pro předchozí pacienty. Pro detekci rakoviny prsu bere trénovací algoritmus vstupy, jako je velikost nádoru, poloměr, zakřivení a obvod, jako vstup. Na výstupu máme pravděpodobnost, že nádor je maligní nebo ne.

Předpověď prodeje :

Rostoucí počet prodejců digitalizuje své záznamy, mnozí z nich začali používat nástroje strojového učení k předpovídání prodeje konkrétní položky v daném týdnu, aby mohli skladovat dostatečné množství zásob. Úvod Techniky strojového učení by převzaly vstupy z prodeje za předchozí rok pro různé položky a našli vzory pro sezónní variace a poskytly konkrétní předpovědi pro prodej určitých položek. Můžeme také identifikovat položky s nízkou výkonností z hlediska tržeb.

Rozpoznávání obličejů:

Pravděpodobně jste při nahrávání obrázků na Facebook zjistili, že značí tváře vašich přátel k jejich jménům. V backend stroji / hlubokém učení algoritmy dělají tuto práci. Stejný základní úvod do principů strojového učení se používá také pro rozpoznávání tváří, kde jsou přiváděny vstupní obrazy obličeje a neuronové sítě jsou trénovány pro klasifikaci těchto obrázků.

Klasifikace textu:

S rostoucí populací přicházející online, se stalo pro společnosti z webů / sociálních médií, jako jsou Twitter, Facebook, Quora, povinné zavádět systémy založené na klasifikaci textů. Twitter / Quora to používá k identifikaci nenávistných komentářů / příspěvků. Některé zpravodajské společnosti také používají algoritmy klasifikace textu pro seskupování podobných článků.

Interpretace zvuku / hlasu:

Někdy se divíte, jak se zařízení jako Alexa, Siri a Google stávají inteligentními každý den v porozumění zvukových dat v různých jazycích s různými přízvuky. Obrovské množství dat je v těchto zařízeních školeno k seznámení s technikami strojového učení, což umožňuje.

Systémy detekce podvodů:

Několik systémů elektronického obchodování využívá systémy detekce podvodů založených na ML, aby identifikovalo zákazníky vytvářející falešné objednávky a také eliminovalo prodejce prodávající padělky na platformě. Bankovní odvětví a další začínající finanční technologie se při detekci podvodných transakcí velmi spoléhají na techniky ML

Doporučení Motory

Společnost Netflix používá k doporučování filmů bez dozoru ML, zatímco Amazon ji používá k doporučování produktů k nákupu.

Výhody

Automatizujte časově náročné úkoly:

Aplikace založené na ML automatizovaly několik úkolů, jako je rozhodování na nízké úrovni, zadávání dat, tel. Volání, procesy schvalování půjček.

Úspora nákladů:

Jakmile je algoritmus vyvinut a uveden do výroby, může způsobit značné úspory nákladů, protože lidská práce a rozhodování jsou minimální.

Doba obratu:

Pro mnoho aplikací je celkový čas prvořadý. ML se podařilo zkrátit čas v doménách, jako jsou například nároky na pojištění vozidel, kde uživatel nahrává obrázky a vypočítá se částka pojištění. Pomohlo také společnostem elektronického obchodování při vyřizování výnosů z prodaných zásob.

Rozhodování na základě dat:

Nejen podniky, ale mnoho vlád se spoléhá na ML při rozhodování o tom, do kterých projektů investovat a jak optimálně využít stávající zdroje.

Nevýhody

Algoritmy ML mohou být zkreslené:

Spousta časů, vstupní data do algoritmu ML je zkreslená na konkrétní pohlaví, rasa, země, kasta atd. To vede k tomu, že algoritmy ML šíří nežádoucí zkreslení do rozhodovacího procesu. To bylo pozorováno v některých aplikacích, které využívaly ML-like přijímací proces školy / vysoké školy a doporučení sociálních médií.

Pro dosažení přijatelné přesnosti vyžadují velká data:

Zatímco lidé se mohou snadno učit pro malé datové sady, pro některé aplikace, úvod do strojového učení vyžaduje obrovské množství dat, aby bylo dosaženo dostatečné přesnosti.

Manipulovat s rozhodnutím uživatele:

Analytická firma Cambridge Analytica nedávno použila ML algoritmy na sociálních médiích k cílení a ovlivnění rozhodnutí voličů.

V současné době může být Úvod do algoritmu strojového učení vhodný do budoucna:

Technika ML trénovaná na aktuálním datovém souboru nemusí být pro budoucnost dobře vhodná, protože distribuce vstupů se může časem významně měnit. Jedním z protiopatření k překonání tohoto je pravidelný trénink modelu.

Doporučené články

Toto byl průvodce Úvodem do strojového učení. Zde jsme diskutovali o strojovém učení se základními body a vlastnostmi úvodu do strojového učení. Můžete se také podívat na následující články:

Techniky strojového učení
Strojové učení vs neuronová síť
Kariéra ve strojovém učení
Rozdíl mezi stroji Big Data Vs Machine Learning
Hyperparametrické strojové učení

Úvod do strojového učení - Aplikace strojového učení

Obsah: