Úvod do velkých dat

Big Data, jak název napovídá, je něco, co souvisí s daty, kde velké znamená velké nebo velké. Jednoduše řečeno, Big Data odkazuje na velké množství dat (z hlediska objemu), které nelze účinně strávit (zpracovat) tradičními aplikacemi pro zpracování dat. Jak se data zvětšují, stává se také složitější a vyžaduje pokročilejší a robustnější matematické a statistické techniky, aby z dat získala, co chceme.

Zde se pokusme porozumět Úvodu k velkým datům s příkladem: Přetočit zpět do 40. let 20. století, žádné počítače, mobilní telefony, internet, digitální život, takže žádná data, ne? Byla tam data, ale nebyla digitální. Tehdy neexistovalo internetové bankovnictví, ale existovaly banky a banky měly zákazníky a transakce prováděné zákazníkem, které nebyly zaznamenány digitálně, ale na papíry, účetnictví a finance a všechny byly prováděny na papíře a peru.

Rychle vpřed do devadesátých let přicházely na trh technologie, počítače a mobilní telefony, výkazy příjmů a rozvahy, které byly provedeny na papírech a uloženy v registrech, které obsahovaly údaje zhruba 500 zákazníků, byly nyní prováděny na Excelu a ukládány na disky, které dokáže uložit více než tisíce zákaznických dat. Zde v úvodu k velkým datům se dozvíme, že jak exponenciálně rostou data, organizace se vybavily více palebnou silou pro efektivnější zpracování dat. Nyní je v jeden jediný den vygenerováno 2, 5 bilionů bajtů (2 500 000 terabajtů) dat. To je obrovské, že? Díky pokročilé technologii bude v blízké budoucnosti téměř každá položka v našem okolí generovat některá data. Již máme k dispozici chytré boty, inteligentní světla, inteligentní polštáře a další gadgety, které denně generují data. Proto je Úvod do velkých dat jednou z životně důležitých technologií, které budou hrát hlavní roli při utváření budoucího světa.

Hlavní komponenty velkých dat

Jak jsme diskutovali výše v úvodu k velkým datům, že to, co jsou velká data, nyní jdeme vpřed s hlavními komponentami velkých dat.

  • Strojové učení

Je to věda o tom, jak počítače naučit věci samy. Při strojovém učení se očekává, že počítač použije algoritmy a statistické modely k provádění konkrétních úkolů bez výslovných pokynů. Aplikace strojového učení poskytují výsledky založené na minulých zkušenostech. V dnešní době jsou například některé mobilní aplikace, které vám poskytnou shrnutí vašich financí, účtů, připomenou vám platby za faktury a také vám mohou navrhnout nějaké plány na spoření. Tyto funkce se provádějí čtením e-mailů a textových zpráv.

  • Zpracování přirozeného jazyka (NLP)

Je to schopnost počítače porozumět lidskému jazyku jako mluvenému. Nejzřetelnějšími příklady, které mohou lidé v dnešní době souviset, je google home a Amazon Alexa. Oba používají NLP a další technologie, aby nám poskytly zážitek virtuálního asistenta. NLP je všude kolem nás, aniž bychom si to uvědomovali. Když píšete e-mail, přestože dělá chyby, automaticky se opraví a v dnešní době dává automatické návrhy na vyplnění e-mailů a automaticky nás zastraší, když se pokusíme odeslat e-mail bez přílohy, na kterou jsme odkazovali v textu e-mailu, toto je součást aplikací pro zpracování přirozeného jazyka, které běží na pozadí.

  • Business Intelligence

Business Intelligence (BI) je metoda nebo proces, který je technologicky zaměřený na získání poznatků analýzou dat a jejich prezentací tak, aby koncoví uživatelé (obvykle vedoucí pracovníci na vysoké úrovni), jako jsou manažeři a vedoucí společnosti, z něj mohli získat některé užitečné informace a přijímat informovaná obchodní rozhodnutí.

  • Cloud Computing

Pokud pojdeme podle názvu, mělo by to být výpočetní zpracování prováděné na cloudu, no, je to pravda, právě tady nemluvíme o reálných cloudech, cloud zde je odkazem na internet. Můžeme tedy definovat cloud computing jako poskytování výpočetních služeb - servery, úložiště, databáze, sítě, software, analytika, inteligence a další - přes internet („cloud“), abychom nabídli rychlejší inovace, flexibilní zdroje a úspory z rozsahu .

Charakteristika velkých dat

V tomto tématu Úvod do velkých dat vám také ukážeme charakteristiky velkých dat.

  • Objem:

Pro určení hodnoty z dat je třeba vzít v úvahu velikost, která hraje klíčovou roli. Také, aby se zjistilo, zda určitý typ dat spadá do úvodu do kategorie velkých dat nebo ne, závisí na objemu.

  • Odrůda:

Odrůda znamená různé typy dat podle jejich povahy (strukturované a nestrukturované). Dříve byly jediným zdrojem údajů, které zvažovala většina aplikací, ve formě řádků a sloupců, které obvykle přicházely v tabulkách a databázích. V dnešní době však data přicházejí ve všech formách, které si dokážeme představit, jako jsou e-maily, fotografie, videa, zvuk a mnoho dalších.

  • Rychlost:

Rychlost jako název napovídá rychlost generování dat. Ze zdroje určuje, jak rychle mohou být data generována a jak rychle mohou být zpracována, potenciál těchto dat.

  • Variabilita:

Data mohou být variabilní, což znamená, že mohou být nekonzistentní, nikoli v toku, což narušuje nebo se stává překážkou při účinném zacházení s daty a jejich správě.

Aplikace velkých dat

Analytika velkých dat se používá následujícími způsoby

  • Zdravotní péče:

Máme dnes nositelná zařízení a senzory, které poskytují aktualizace zdravotního prohlášení pacienta v reálném čase.

  • Vzdělávání:

Pokrok studenta lze sledovat a zlepšit vhodnou analýzou pomocí analýzy velkých dat.

  • Počasí:

Senzory počasí a satelity, které byly rozmístěny po celém světě, shromažďují obrovské množství dat a používají je ke sledování počasí a okolních podmínek a také předpovídají nebo předpovídají povětrnostní podmínky pro nadcházejících několik dní.

Výhody a nevýhody velkých dat

Jak jsme studovali úvod do velkých dat, nyní pochopíme výhody a nevýhody velkých dat :

Výhody

Nevýhody
Lepší rozhodováníKvalita dat: kvalita dat musí být dobrá a uspořádaná, aby mohla pokračovat s analýzou velkých dat.
Zvýšená produktivitaHardwarové potřeby: Úložný prostor, který musí být k dispozici pro uložení dat, šířku pásma sítě pro přenos do az analytických systémů, je drahý na nákup a údržbu prostředí velkých dat.
Snížení nákladůRizika kybernetické bezpečnosti: Ukládání citlivých a velkého množství dat může společnosti učinit atraktivnějším cílem pro kybernetické útočníky, kteří mohou data použít pro výkupné nebo jiné nezákonné účely.
Vylepšený zákaznický servisŠkytavka při integraci se starými systémy: Mnoho starých podniků, které již dlouho podnikají, uložilo data v různých aplikacích a systémech v různých architekturách a prostředích. To způsobuje problémy s integrací zastaralých zdrojů dat a pohyblivých dat, což dále zvyšuje čas a náklady na práci s velkými daty.

Doporučené články

Toto byl průvodce Úvodem do velkých dat. Zde jsme diskutovali Úvod do velkých dat s hlavními komponenty, charakteristikami, výhodami a nevýhodami velkých dat. Můžete se také podívat na následující články:

  1. Software Big Data Analytics
  2. Data Scientist vs Big Data
  3. Úlohy analýzy velkých dat

Kategorie: