Přehled dovedností požadovaných pro vědce v oblasti dat

V roce 2012 Harvard business review uvedl, že „Data Scientist je nejsmutnější prací 21. století“. Předtím, abychom věděli, jaké dovednosti jsou zapotřebí, aby byl datový vědec první, uvidíme, co dělá datový vědec. Existuje mnoho způsobů, jak lze definovat vědce dat, ale abychom to zjednodušili, řekněme to tímto způsobem: Data Scientist je někdo, kdo je schopen extrahovat význam a získat cenné informace z dat. Práce vědce s údaji zahrnuje především sběr, čištění a manipulaci s daty.

Technické a netechnické dovednosti

Nyní se podívejme na technické a netechnické dovednosti, které jsou nezbytné pro to, abyste byli vědcem v oblasti dat.

Technické dovednosti

Technické dovednosti potřebné k tomu, aby byl datovým vědcem, jsou uvedeny níže.

1. Schopnost vypořádat se s velkým množstvím dat

Množství generovaných dat se od posledních několika let exponenciálně zvyšuje a většina z nich je klasifikována jako nestrukturovaná data. Nestrukturovaná data se obvykle označují jako data, která se nenacházejí v tradiční databázi řádkových sloupců, která je přesně naproti strukturovaným datům. Příkladem nestrukturovaných dat jsou videa, fotografie a zvukové zprávy. Protože hlavní úlohou datového vědce je získávat z dat význam, měl by být pohodlný způsob, jak nakládat s velkým množstvím údajů bez ohledu na povahu, zda je strukturovaná nebo nestrukturovaná.

2. Vizualizace dat

Data generovaná ve společnostech musí být převedena do formátu, který je snadno srozumitelný, aby bylo možné činit rozhodnutí. Jako datový vědec musí být možné vizualizovat data pomocí nástrojů jako Tableau, Plotly, Visual.ly, D3.js a Power BI. Je také důležité, aby se vědec s daty seznámil s principy vizuálního sestavování dat. To je pro vědce údajů jedna z důležitých úloh, protože vizualizace dat je jedinou možností, jak mohou společnosti přímo pracovat s daty.

3. Statistiky

Úloha statistik ve vědě o údajích je velmi důležitá. Pro vědce dat je statistika matematická disciplína, která poskytuje potřebné nástroje a metody k nalezení vzorců a poskytuje informace o složité sadě dat provedením matematických výpočtů. Vzhledem k tomu, že úkolem vědce v oblasti dat je extrahovat význam identifikací vzorců v datech, jsou znalosti ve statistice klíčovou dovedností pro vědce v oblasti dat.

4. Programovací dovednosti

S množstvím dat generovaných před 20 lety by Excel stačil na to, aby se s tím vypořádal, ale s množstvím strukturovaných a nestrukturovaných dat, která generuje dnešní data, by vědci měli mít znalosti v programovacích nástrojích jako Python, R, SQL as

  • Poskytují větší prostor pro školení souboru údajů pomocí mnoha statistických technik
  • Zvyšují efektivitu procesu při provádění analýzy dat

5. Manipulace s daty

Ve většině případů budou data, která potřebujeme, chaotická a pro vědce s daty bude obtížné pracovat s takovým typem dat. Takže po získání dat z datových jezer je prvním krokem řešení těchto nedokonalostí. Některé nedokonalosti zahrnují chybějící hodnoty, nepravidelné řetězce jako LA pro Los Angeles, formátování data jako 10. 9. 2009 a 2009/09/10. Všechny tyto nedokonalosti musí být před zahájením tréninku nebo analýzy dat roztříděny.

6. Multifunkční počet a lineární algebra

Pochopení pojmů matice (lineární algebra) a diferenciace (počet) je důležitá dovednost, kterou by měl mít datový vědec. V organizaci, kde její stávající data hrají hlavní roli při vytváření budoucích předpovědí, mohou malá zlepšení v prediktivním výkonu nebo algoritmické optimalizaci pro organizaci znamenat velký rozdíl. V počátečních fázích datového vědce nemusí být při použití předem kódovaných modelů nutné důkladné porozumění maticím nebo kalkulu, ale abychom pochopili, co se děje pod kapotou modelů, nebo aby si vytvořili vlastní implementace, je rozhodně nutné porozumět těmto pojmům.

Netechnické dovednosti

Níže jsou uvedeny netechnické dovednosti, které musí být vědcem údajů.

1. Intelektuální zvědavost

Při analýze dat organizace ve většině případů nikdo neuvidí přímé výsledky ani odpovědi. Čím více otázek začnete klást, tím více odpovědí zjistíte z údajů. Obecně je zvědavost definována jako silná touha něco pochopit. To je důvod, proč je intelektuální zvědavost velmi důležitou vlastností vědce s údaji.

2. Silný obchodní důraz

Bez pochopení dat organizace nebo prvků v obchodním modelu nebudou všechny technické dovednosti, které má vědec s údaji, k dispozici pro organizaci požadované výsledky, protože nebude schopen pochopit, které funkce v datovém souboru jsou. měla by mít prioritu a měla by být považována za poslední. Takže pro vědce v oblasti dat pomůže porozumění obchodního modelu a datům organizace vyřešit potenciální výzvy, které z něj vyplývají pro udržení a rozvoj jejich podnikání.

3. Silné komunikační dovednosti

Jako vědec v oblasti dat by měl člověk připravit prezentaci o svých technických poznatcích a prezentovat ji netechnickým týmům, jako jsou obchodní oddělení, někdy v kariéře. Jako vědec s údaji by měl mít dovednosti, jako je vyprávění příběhů (schopnost vyprávět příběhy ze zjištění), protože celé množství času a energie vynaložené na průzkum dat, použití statistických technik, zjišťování výsledků a všechny ostatní věci budou zbytečné. pokud datový vědec není schopen předat zprávy řádně obchodním manažerům. A ve většině případů nebudou mít obchodní manažeři zájem naslouchat všem krokům, které jsme učinili, abychom dospěli k závěrům, budou se zaměřovat hlavně na výsledky a prezentované hodnoty. Proto je vždy nejlepší udržet příběh ostrý a na místě.

Závěr - Dovednosti potřebné pro vědce v oblasti dat

To jsou některé z nejdůležitějších dovedností, které by člověk měl mít, aby byl datovým vědcem, protože jejich hlavní práce zahrnuje práci na datech organizace, jejich analýzu a prezentaci manažerům podniku.

Doporučené články

Toto je průvodce dovednostmi požadovanými pro vědce v oblasti dat. Zde diskutujeme o technických a netechnických dovednostech, které jsou nezbytné pro to, aby byl vědcem údajů. Další informace naleznete také v dalších navrhovaných článcích -

  1. Kariéra Data Science
  2. Jazyky vědy o údajích
  3. Plat velkých dat Analytics
  4. Rozhovor s analytiky dat
  5. Formát změny data PHP

Kategorie: