Rozdíl mezi datovou vědou a těžbou dat
Dolování dat je o nalezení trendů v sadě dat. A pomocí těchto trendů identifikovat budoucí vzorce. Je to důležitý krok v procesu zjišťování znalostí. Často zahrnuje analýzu obrovského množství historických dat, která byla dříve ignorována. Data Science je obor, který zahrnuje vše od analýzy velkých dat, těžby dat, prediktivního modelování, vizualizace dat, matematiky a statistiky. Data Science byla označována jako čtvrté paradigma vědy. (další tři jsou teoretická, empirická a výpočetní). Akademie často provádí exkluzivní výzkum v oboru Data Science.
Historická perspektiva
Než přejdeme k technickým popisům, podívejme se na vývoj termínů. Historické šetření objasní, jak se tyto termíny v současnosti používají.
- Slovo „Data Science“ bylo kolem šedesátých let, ale tehdy se používalo jako alternativa k „Computer Science“. V současné době má úplně jiný význam.
- V roce 2008 se DJ Patil a Jeff Hammerbacher stali prvními jedinci, kteří se nazývají „Data Scientists“, aby popsali svou roli na LinkedIn a Facebooku.
- V roce 2012 článek Harvard Business Review citoval Data Scientist jako „nejsmutnější práci 21. století“.
- Termín dolování dat se vyvíjel paralelně. V 90. letech 20. století se mezi databázovými komunitami stala převládající.
- Data Mining vděčí za svůj původ společnosti KDD (Knowledge Discovery in Databases). KDD je proces hledání znalostí z informací přítomných v databázích. A Data Mining je hlavní podproces v KDD.
- Dolování dat je často používáno zaměnitelně s KDD.
Ačkoli se tato jména objevují samostatně, často se navzájem doplňují, protože ostatně úzce souvisí s analýzou dat.
Srovnání mezi hlavami mezi Data Vs Data Mining (Infographics)
Níže je uvedeno Top 9 Srovnání Data Vs Data Mining
Příklad použití případu
Zvažte scénář, ve kterém jste hlavním prodejcem v Indii. Máte 50 obchodů působících v 10 velkých městech v Indii a jste v provozu 10 let.
Řekněme, že chcete studovat údaje za posledních 8 let a zjistit počet prodejů sladkostí během svátků 3 měst. Pokud je to váš cíl, doporučuji vám zaměstnat osobu s odbornými znalostmi o dolování dat. Data Miner by pravděpodobně procházel historickými informacemi uloženými ve starých systémech a využíval algoritmy k extrahování trendů.
Zvažte další případ, kdy chcete vědět, které sladkosti získaly pozitivnější recenze. V takovém případě nemusí být vaše zdroje dat omezeny na databáze, mohou se rozšířit na sociální weby nebo na zpětnou vazbu od zákazníků. V tomto případě bych vám navrhl zaměstnat datového vědce. Osoba zaměstnaná jako Data Scientist je vhodnější použít algoritmy a provádět tuto socio-výpočetní analýzu.
Klíčové rozdíly mezi datovou těžbou dat Vs
Níže je rozdíl mezi vědou a těžbou dat následující
- Data Mining je činnost, která je součástí širšího procesu vyhledávání znalostí v databázích (KDD), zatímco Data Science je oborem stejně jako aplikovaná matematika nebo informatika.
- Data Science je často vnímána v širokém smyslu, zatímco Data Mining je považována za mezeru.
- Některé činnosti v rámci dolování dat, jako je statistická analýza, zápis datových toků a rozpoznávání vzorů, se mohou protínat s datovou vědou. Data Mining se proto stává podmnožinou Data Science.
- Strojové učení v těžbě dat se používá více při rozpoznávání vzorů, zatímco v Data Science má obecnější použití.
Poznámka
- Data Science a Data Mining by neměly být zaměňovány s Big Data Analytics a jeden může mít jak horníky, tak vědce pracující na velkých souborech dat.
Srovnávací tabulka dolování dat Data Science Vs
Základ pro srovnání | Těžba dat | Data Science |
Co je to? | Technika | Oblast |
Soustředit se | Obchodní proces | Vědecká studie |
Fotbalová branka | Zvyšte použitelnost dat | Vytváření datově orientovaných produktů pro organizaci |
Výstup | Vzory | Pestrý |
Účel | Nalezení trendů dříve nebylo známo | Sociální analýza, vytváření predikčních modelů, odhalení neznámých skutečností a další |
Odborná perspektiva | Dolování dat může provádět někdo se znalostí navigace mezi daty a statistickým porozuměním | Člověk musí pochopit strojové učení, programování, infografické techniky a musí mít znalosti domény, aby se stal vědcem v oblasti dat |
Rozsah | Dolování dat může být podmnožinou Data Science, protože těžební činnosti jsou součástí potrubí Data Science | Multidisciplinární - věda o data se skládá z vizualizace dat, výpočetních sociálních věd, statistiky, dolování dat, zpracování přirozeného jazyka, atd. |
Nabídky s (typ dat) | Většinou strukturované | Všechny formy dat - strukturované, polostrukturované a nestrukturované |
Další méně oblíbená jména | Archeologie dat, sběr informací, vyhledávání informací, extrakce znalostí | Věda založená na datech |
Závěr - Data Science Vs Mining
Tak jdete! Jsem si jist, že si nyní více uvědomujete, jaké jsou hlavní rozdíly mezi nimi a v jakém kontextu by se měly tyto dva využít. Jedna věc, kterou byste si měli pamatovat, je, že neexistují žádné formální a přesné definice Data Science a Data Mining. Mezi akademickou obcí a průmyslem stále probíhají debaty o tom, co představuje přesnou definici. Všichni jsou však na stejné stránce, pokud jde o rozdíly na vysoké úrovni a popisy dvou termínů, které jsme prozkoumali v tomto článku.
Doporučený článek
Toto byl průvodce Data Data Vs Mining, jejich význam, Head to Head Srovnání, Key Differences, srovnávací tabulka a Závěr. Další informace naleznete také v následujících článcích -
- Data Science a její rostoucí význam
- 7 Důležité techniky dolování dat pro dosažení nejlepších výsledků
- Predictive Analytics vs Data Science - Naučte se 8 užitečných srovnání
- 8 Důležité techniky dolování dat pro úspěšné podnikání