Prediktivní analytika vs dolování dat - který z nich je užitečnější

Obsah:

Anonim

Rozdíl mezi prediktivní analýzou a těžbou dat

Prediktivní analytika je proces zdokonalování tohoto datového zdroje pomocí obchodních znalostí k získání skryté hodnoty z těchto nově objevených vzorců. Dolování dat je objevování skrytých vzorců dat pomocí strojového učení - a sofistikované algoritmy jsou těžebními nástroji.

Dolování dat + znalosti domény => prediktivní analýza => obchodní hodnota

Srovnání Head to Head mezi prediktivní analýzou a dolováním dat

Níže je 5 srovnání mezi prediktivní analýzou a těžbou dat

Klíčové rozdíly mezi prediktivní analýzou a těžbou dat

Níže je rozdíl mezi prediktivní analýzou a těžbou dat

Proces - Proces těžby dat lze shrnout do šesti fází -

a.Business/Research Understanding Phase - Jasně vyjasněte cíle a požadavky projektu z hlediska obchodní nebo výzkumné jednotky jako celku
b.Data Understanding Phase - shromažďujte a používejte průzkumnou analýzu dat, abyste se s daty seznámili a objevili počáteční poznatky.
c.Data fáze přípravy - Vyčistěte a aplikujte transformaci na nezpracovaná data, aby byla připravena na nástroje pro modelování
d.Modeling Phase - Vyberte a použijte vhodné techniky modelování a kalibrujte nastavení modelu pro optimalizaci výsledků.
e.Evalation Phase - Fáze hodnocení - modely musí být vyhodnoceny z hlediska kvality a účinnosti před nasazením. Také určit, zda model ve skutečnosti dosahuje cílů stanovených pro něj ve fázi 1.
f.Deployment Phase - Využijte modely ve výrobě.might může být jednoduché nasazení, jako je vygenerování zprávy nebo složité, jako je implementace paralelního procesu těžby dat v jiném oddělení.

Kroky na vysoké úrovni v oblasti procesů prediktivní analýzy

a.Definujte obchodní cíl - Jakého obchodního cíle je třeba dosáhnout a jak se data hodí. Například obchodním cílem je efektivnější nabídka pro nové zákazníky a potřebná data je segmentace zákazníků se specifickými atributy.
b.Collect Additional Data - Dalšími potřebnými údaji mohou být data uživatelského profilu z online systému nebo data z nástrojů třetích stran pro lepší pochopení dat.To pomáhá najít důvod za vzorem. Někdy se provádějí marketingové průzkumy ke sběru dat
c.Draft Predictive Model - Model vytvořený s nově shromážděnými daty a obchodními znalostmi. Model může být jednoduchým obchodním pravidlem jako „Je větší šance na převedení uživatelů z Indie do Indie z Indie, pokud poskytneme nabídku takto“ nebo složitý matematický model.

Business Value - Data Ming sama o sobě přidává hodnoty pro podnikání jako

a. Důkladně porozumět segmentům zákazníků napříč různými dimenzemi
b.Získejte vzorec výkonu specifický pro KPI (např. roste předplatné s aktivními uživateli počet?)
c.Identify Pokusy o podvodnou aktivitu a zabránit jí.
d.Systémové výkonové vzorce (např. - doba načítání stránky na různých zařízeních - nějaký vzor?)

Prediktivní analytika umožňuje organizaci poskytnout tři výhody:

a.Vision - Pomáhá vidět, co je ostatním neviditelné. Vizuální analytika může projít mnoha minulými zákaznickými údaji, spojit je s jinými údaji a shromáždit všechny kusy ve správném pořadí.
b.Decision - Kvalitní prediktivní analytický model poskytuje analytické výsledky bez emocí a zaujatosti. Poskytuje konzistentní a nezaujatý pohled na podporu rozhodnutí.
c.Precision - Pomáhá používat automatizované nástroje k provádění reportovacích úloh za vás - šetří čas a zdroje, snižuje lidské chyby a zvyšuje přesnost.

Měření výkonu - Výkon procesu dolování dat měřený podle toho, jak dobře model najde vzory v datech. Většinou to bude regresní, klasifikační nebo shlukovací model a pro všechny je dobře definovaná míra výkonu.
Výkon prediktivní analýzy se měří na dopad na podnikání. Příklad - Jak dobře fungovala cílená reklamní kampaň ve srovnání s obecnou kampaní ?. Bez ohledu na to, jak dobře je možné najít modely pro získávání dat, aby fungovaly prediktivní modely, musí být obchodní vhled nutností.

Budoucnost - pole těžby dat se vyvíjí velmi rychle. Pokoušíme se najít vzory v datech s menšími datovými body s minimálním počtem funkcí pomocí sofistikovanějších modelů, jako jsou Deep Neural Networks. Mnoho průkopníků v této oblasti, jako je Google, se také snaží zjednodušit a zpřístupnit tento proces všem. Jedním z příkladů je Cloud AutoML od společnosti Google.
Prediktivní analytika rozšiřující se do celé řady nových oblastí, jako je predikce retence zaměstnanců, predikce kriminality (aka prediktivní policie) atd. Ve stejné době se organizace snaží přesněji předpovídat shromažďováním maximálních informací o uživatelích, jako jsou kam směřují, jaký typ videa sledují atd.

Srovnávací tabulka mezi prediktivní analýzou a těžbou dat

Níže jsou uvedeny seznamy bodů, popište srovnání mezi prediktivní analýzou a dolováním dat:

Základy srovnáníTěžba datPrediktivní analýza
DefiniceDolování dat je proces objevování užitečných vzorců a trendů ve velkých souborech dat.Prediktivní analytika je proces získávání informací z velkých datových souborů, aby bylo možné předpovídat a odhadovat budoucí výsledky.
DůležitostPomozte lépe porozumět shromážděným datům. Např:

● Lepší porozumění segmentům zákazníků

● Nakupujte vzor napříč geografií nebo časem

● Analytika chování prostřednictvím clickstream

● Analýza časové osy ceny akcií.

● GPS údaje o ulicích

Předpovídejte výsledky těžby dat pomocí znalosti domény -

● Jaký zákazník bude kupovat dále?

● Jaká bude míra odlivu zákazníků?

● Kolik nových odběrů bude zahájeno, pokud bude tato nabídka poskytnuta?

● Jaké množství produktu je potřeba pro následující měsíc

RozsahChcete-li najít skryté vzory, použijte algoritmy strojového učení, jako je regrese, klasifikace na shromážděná dataAplikujte obchodní znalosti na vzorce důlních dat s veškerými dalšími údaji potřebnými k získání platných obchodních předpovědí
VýsledekVýstupem dolování dat bude vzorec v datech ve formě časové osy s různou distribucí nebo shluky.Ale to neodpovídá, proč k tomuto vzoru došlo?Prediktivní analytika se snaží najít odpovědi na vzorec s využitím obchodních znalostí a tím z něj učinit více informací.
Zapojení lidéVětšinou je provádějí statistici a inženýři strojového učení, kteří mají silné matematické zázemí pro vytváření funkcí a vytváření ML modeluZde musí být zajištěny znalosti specifické pro podnikání a jasný obchodní cíl. Obchodní analytici a další odborníci na domény mohou analyzovat a interpretovat vzorce objevené stroji, z užitečného významu z datových vzorců a odvozování použitelných poznatků

Závěr -Pictictive Analytics vs dolování dat

Jak řekl Rick Whiting v InformationWeek Co bude dál, je to, co bude dál. Vizuální analytika je místo, kde se odehrává obchodní inteligence. Důlní těžba pomáhá organizacím jakýmkoli způsobem a jedním z nejdůležitějších je vytvořen dobrý základ pro prediktivní analýzu

Doporučený článek

Byl to průvodce rozdílem mezi prediktivní analýzou a těžbou dat, jejich významem, porovnáním hlava-hlava, klíčovými rozdíly, srovnávací tabulkou a závěrem. Další informace naleznete také v následujících článcích -

  1. Predictive Analytics vs Data Science - Naučte se 8 užitečných srovnání
  2. Data Analytics Vs Predictive Analytics - Který z nich je užitečný
  3. 7 Nejužitečnější rozdíl mezi těžbou dat a těžbou webu
  4. Data Warehousing VS Data Mining - 4 úžasná srovnání
  5. Úvod do architektury dolování dat