Jak pracuje profesionál v datové analytice | robot_dreams Czech
should_authorize_via_email
email.input_code tel.input_code
 
email.code_actual_for tel.code_actual_for
apply_exit_text
session_ended
to_homepage
Co dělá datový analytik?

Co dělá datový analytik?

Jak pracovat s daty: odborníci sdílejí své zkušenosti.

Hypotézy, které nejsou podloženy daty, mohou vést k chybám. Zvláště když se fakta přizpůsobují teoriím a ne naopak. Tato myšlenka je základem analýzy dat: vytěžit z informací to podstatné, aby bylo možné činit informovaná rozhodnutí.

Chatboti pro sledování zásilek, doporučování filmů a hudby, rozpoznávání obličejů, samořídící auta, personalizované interakce mezi bankami a zákazníky – nic z toho by nebylo možné bez analýzy dat. 94 % podniků považuje analýzu dat za důležitou oblast pro obchodní růst a digitální transformaci. Množství dat neustále roste, a proto je potřeba stále více analytiků, kteří s nimi budou pracovat.

O své zkušenosti se s námi podělila Lilia Lutsenko, produktová analytička ve společnosti Wise a lektorka kurzu „Produktová analytika: Jak porozumět produktu prostřednictvím metrik“ a Dmytro Usmanov, vedoucí analytického oddělení ve společnosti United Tech a autor odborného telegramového kanálu.

Lilia:  „Můj pracovní den začíná kontrolou stavu metrik produktu a analýzou aktuálních A/B testů. Kolem oběda – schůzky a diskuse, backlog grooming a na konci dne – práce s úkoly od týmů.

Mezi mé povinnosti patří příprava A/B testů, analýza výsledků implementace nových nebo vylepšení starých funkcí, příprava doporučení, jak rozvíjet funkčnost.“

Dmytro: „Pracoval jsem na projektech s mobilními aplikacemi a v oblasti eGov. Práce datového analytika je důležitá. Pomáhá produktu vydělávat více peněz díky výzkumu a A/B testování a navíc optimalizuje náklady.“

Typy analýzy dat

Existuje několik přístupů k definici typů analýzy dat. Jmenujme ty hlavní.

Statistická analýza. Pomáhá najít odpověď na otázku „co se stalo?“, popisuje a shrnuje kvantitativní data. Statistická analýza může například ukázat rozdělení tržeb podle skupin zaměstnanců a průměrné tržby na zaměstnance.

Diagnostická analýza. Určuje, „proč se to stalo“. Předpokládejme, že do nemocnice přijde hodně pacientů. Analýza dat může ukázat, že mají společné příznaky určitého viru. To pomůže určit, jaký druh viru epidemii vyvolal (příčina, „proč“).

Prediktivní analýza. Na rozdíl od předchozích typů analytik, které zkoumají data a vyvozují závěry o minulosti, prediktivní analytika používá data k předpovídání budoucnosti. Odpovídá na otázku „co se může stát v budoucnu?“. Například pomáhá, když si všimnete, že mobilní aplikace pro hubnutí je častěji stahována na jaře a v zimě počet stažení naopak klesá. Proto je lepší naplánovat migraci z jedné databáze do druhé na zimu – případné výpadky postihnou méně uživatelů.

Preskriptivní analýza. Shromažďuje poznatky z prvních tří typů analýz a používá je k formulování doporučení, podle kterých by společnost měla jednat. Odpovídá na otázku „co s tím máme dělat?“. Na základě výsledků této analýzy může společnost sestavit strategii na 5–10 let.

Metody analýzy dat

Shluková analýza – seskupování dat podle podobnosti. Často se používá k nalezení skrytých vzorců v datech. Obchodníci například seskupují zákazníky do skupin na základě demografických údajů nebo jiných faktorů, aby přizpůsobili nabídku. Dělat to pro každého klienta zvlášť by nebylo možné.

Kohortová analýza – pomáhá studovat chování uživatelů. Může být užitečné ukázat dopad kampaní na konkrétní skupiny zákazníků. Společnost například vytváří různé typy e-mailů, které odesílá uživatelům, a poté sleduje efektivitu každého typu.

Regresní analýza – využívá historická data k pochopení toho, jak proměnné ovlivňují výsledek. Společnost například analyzovala tržby za rok 2017 a zjistila, že na výsledek měla vliv kvalita produktů, design prodejny a zákaznický servis. Nyní můžete pomocí regrese analyzovat, které z těchto proměnných se změnily a zda se v průběhu roku 2022 objevily nové.

Faktorová analýza – analytická metoda pro optimalizaci určitých segmentů dat. Příkladem je hodnocení produktu kupujícím: jakým faktorům věnuje pozornost při výběru produktu.

Textová analýza – organizace velkého množství dat způsobem, který usnadňuje jejich správu. Jedná se také o čištění dat, které umožňuje získat přesně ta data, která jsou potřebná pro určitý účel.

Proces analýzy dat

Fáze analýzy dat zahrnují sběr, zpracování a studium informací s cílem nalézt vzorce a zákonitosti. Proces obsahuje:

1. Definování požadavků a cílů. Je třeba pochopit účel analýzy, jaký typ analýzy je pro ni nejvhodnější a co přesně by mělo být analyzováno.

2. Sběr dat. Zdroje – výzkumy, průzkumy, rozhovory, dotazníky, pozorování, focus groups.

3. Zpracování a čištění. V této fázi se odstraní duplicitní, neplatné nebo irelevantní údaje.

4. Analýza. Analytici mohou použít různé metody, aby pochopili, co jim data říkají. Například průměrná hodnota usnadňuje pochopení údajů: eliminuje individuální rozdíly a shrnuje charakteristiky ukazatele. Medián ukazuje strukturu dat a zároveň zachovává individuální rozdíly v ukazateli.

5. Výklad. Výsledky by měly být interpretovány a na jejich základě by měl být navržen akční plán.

6. Vizualizace. Informace je nutné prezentovat tak, aby byly snadno čitelné a srozumitelné. Můžete používat grafy, diagramy, mapy, prezentace, infografiky. Vizualizace pomáhá porovnávat soubory dat a pozorovat vztahy.

Například pro analýzu trhu s nemovitostmi určuje datový analytik cíle, z nichž jedním je vypočítat optimální náklady na komfortní bydlení. Bude shromažďovat údaje o poloze budov (prestiž areálu, infrastruktura, vzdálenost k MHD), údaje o typu budovy, rozloze, dostupnosti oprav. Následuje sběr dat z otevřených zdrojů, odstranění nepodstatných (například zastaralých) údajů a analýza.

Výsledkem analýzy jsou závěry, které lze prezentovat formou infografiky.

Požadavky na datového analytika

Americký Úřad pro statistiku práce předpovídá nárůst počtu datových vědců, přičemž oblast datové vědy poroste do roku 2031 přibližně o 23 %.

Lilia: „Datoví analytici pomáhají činit správná rozhodnutí o směru vývoje produktu. Moderní datový analytik potřebuje znát statistiku, matematiku, umět pracovat s databázemi, analyzovat a vizualizovat data. Z technologií – SQL, Tableau, Power BI, Data Studio, Python.“

Nástroje, které datoví analytici používají:

  • Databázové nástroje. SQL zpracovává velké datové soubory a Microsoft Excel zobrazuje data.
  • Programovací jazyky. Jazyk pro statistické zpracování dat umožňuje zpracovávat velké soubory dat. Nejčastěji se používá Python a R, ale i další jazyky. Vše závisí na projektu.
  • Vizualizace dat. Prezentace výsledků v optimální formě pro vnímání pomáhá ukázat práci analytika. K tomuto účelu se často používají Tableau, Jupyter Notebook a Power BI.

Dmytro: „ Potřebujete především matematický základ: lineární algebru, teorii pravděpodobnosti, statistiku. O něco méně potom matematickou analýzu a diskrétní matematiku.

Pro vizualizaci se obvykle používá BI: Tableau a PowerBI jsou lídry na trhu, ale někdy se můžete setkat i s Redash, Superset, Qlik a dokonce i s knihovnami pro Python – Matplotlib, Seaborn, Plotly.

Jazyk SQL je velmi důležitý. Chcete-li se s ním naučit pracovat, existují dobré simulátory, ale lepší je procvičovat na skutečných úkolech. Pro trénink můžete použít SQL Zoo.

Některé společnosti vyžadují znalost Pythonu, většinou ale jen základní dovednosti v práci s nejoblíbenějšími analytickými knihovnami (Pandas, Numpy, Sklearn, Seaborn, Matplotlib a další).“

Ze soft skills je pro výkon profese důležitá především schopnost řešit problémy. Analytik musí rozumět problému produktu, který je třeba vyřešit: například proč aplikaci nepoužívají lidé ve věku 30–35 let. Také je nezbytné sledovat trendy, myslet kriticky a ve své práci nacházet příležitosti ke zlepšení. Neméně důležitá je schopnost umět jasně sdělovat své myšlenky.

Autor: Krasnynska Maria

Více článků
Příručka od robot_dreams s příkladem syntaxe
Kam se dnes posouvají technologické hranice robotiky?