Matematika & statistika pro data science

Vybuduj základy pro kariéru
v datové analýze a strojovém učení

Ovládni svět dat s kurzem aplikované statistiky pro datovou vědu! Získej nejen teoretické znalosti, ale i praktické dovednosti, které ti poslouží jako základ pro strojové učení a datovou analýzu.

Rezervuj si místo

O kurzu:

Propoj teorii s praxí v našem kurzu matematiky a statistiky pro datovou vědu! Nauč se analyzovat data s matematickou přesností a ovládni Python pro řešení reálných datových výzev. Získej praktické dovednosti v data science, od základních statistických konceptů až po pokročilé techniky analýzy dat.

Požadavky

K absolvování kurzu potřebuješ znát základy Pythonu, Javy, C# nebo jiného jazyka, základní pojmy z integrálního a diferenciálního počtu, metrických prostorů a základy pravděpodobnosti.

12 online lekcí
Python a Jupyter Notebook
Knihovny pro data science

Kurz je vhodný pro:

Softwarové inženýry

Porozumíš matematickým a statistickým principům.
Naučíš se aplikovat matematické a statistické koncepty.
Získáš praktické zkušenosti s Pythonem a jeho knihovnami.

Junior datové analytiky

Pronikneš hlouběji do konceptů datové analýzy.
Naučíš se pracovat s reálnými příklady.
Efektivně využiješ nástroje pro analýzu a vizualizaci dat.

Připravujeme

Chci se přihlásit

Lektor

Jan Kohout

Senior Data Scientist ve startupu TruU, kde se věnuje využití umělé inteligence pro autentizaci uživatelů bez použití hesel.
Je absolventem teoretické informatiky na Matematicko-fyzikální fakultě UK a doktorského studia na FEL ČVUT se zaměřením na využití strojového učení pro zabezpečení počítačových sítí.
Ve společnosti Cisco Systems pracoval 9 let na návrhu algoritmů pro detekci anomálií, bezpečnostních incidentů a modelování chování za pomoci umělé inteligence.
Je (spolu)autorem odborných článků a patentů z oblasti využití strojového učení v bezpečnosti s několika stovkami citací.

Program

- Lekce 1
Úvod, základy jazyka Python, základní knihovny

—> Přehled a cíle kurzu
—> Proč je matematika/statistika potřebná pro datovou analýzu
—> Základy Pythonu – proč Python, Jupyter Notebook, základní konstrukce, datové struktury a knihovny pro data science (numpy, MatPlotLib), conda/pip, odevzdávání úkolů
- Lekce 2
První kroky při analýze dat

—> Knihovna Pandas, struktura DataFrame
—> Základní charakteristiky – průměr, modus, median, matice dat…
—> Vizualizace dat

Úkol: Načtení datasetu v Pandas, práce se sloupci a řádky, výběr a základní analýza dat
- Lekce 3
Základy pravděpodobnosti

—> Pravděpodobnost, statistika, náhodné jevy, pravděpodobnostní prostor, (ne)závislost jevů
—> Empirický odhad pravděpodobnosti, histogram, vizualizace
—> Množiny – operace, Vennovy diagramy, vztah ke kombinatorice a pravděpodobnosti
—> Podmíněná pravděpodobnost, Bayesova věta, naivní Bayesovský klasifikátor (NBC)
- Lekce 4
Náhodné veličiny

—> Základní pojmy – distribuční funkce, rozdělení pravděpodobnosti, spojité x diskrétní veličiny
—> Charakteristiky náhodné veličiny – střední hodnota, rozptyl, entropie, korelace náhodných veličin
—> Vybraná známá rozdělení, náhodné generátory dat

Úkol: Empirický odhad pravděpodobnosti - vlastní implementace NBC
- Lekce 5
Modelování pravděpodobnosti, detekce anomálií

—> Připomenutí empirického odhadu pravděpodobnosti, vztah k histogramu a využití k odhadu distribuční funkce
—> „Kernel density estimation“ (KDE), vícerozměrná data
—> Odhad hustoty pravděpodobnosti pomocí k-nejbližších sousedů
—> Detekce anomálií na základě pravděpodobnosti, příklady

Zobrazit celý program Skrýt program

- Lekce 6
Odhadování parametrů, testování hypotéz

—> Bodový vs. intervalový odhad parametru, konfidenční interval
—> Odhad na základě maximální věrohodnosti
—> Centrální limitní věta
—> Statistické testy, p-hodnota, příklady
- Lekce 7
Klasifikace a regrese – učení, příprava dat, metody

—> Rozdíl klasifikace vs. regrese, příklady klasifikátorů
—> Princip učení klasifikátorů, příprava trénovacích dat
—> Příklady klasifikátorů a jejich principy – připomenutí NBC, rozhodovací stromy, k-NN, lineární klasifikátor
- Lekce 8
Vyhodnocení a porovnávání klasifikátorů

—> Vyhodnocení kvality klasifikátoru, příprava testovacích dat
—> Křížová validace
—> ROC křivka – význam, sestavení, interpretace
—> Porovnání více klasifikátorů, vztah k testování hypotéz

Úkol: Vyhodnocení kvality klasifikátorů na vybrané klasifikační úloze
- Lekce 9
Regrese – metody, vyhodnocení

—> Příklady regresní analýzy – základní pojmy
—> Příklady metod – lineární regrese, logistická regrese
—> Učení, měření chyby
- Lekce 10
Reprezentace dat, generativní modely (přehledově)

—> Reprezentace dat pro zpracování algoritmy klasifikace/regrese – vektorizace textových dokumentů, obrázků apod.
—> Učení reprezentací
—> Generování dat pomocí modelů – základní principy

Úkol: Závěrečná úloha.
- Lekce 11
Postup při řešení úlohy, shrnutí, zadání závěrečného úkolu

—> Příklad řešení úlohy „od začátku do konce“, upozornění na problémy
—> Shrnutí kurzu
—> Zadání závěrečného úkolu
- Lekce 12
Workshop a diskuze s lektorem o závěrečném projektu, Q&A, pracovní trh

Získat více informací

Vyplň registrační formulář a připoj se k nám!
Náš robot_dreams tým se s tebou spojí co nejdříve,
abys získal*a všechny potřebné detaily o obsahu kurzu a jeho ceně.

ZÍSKAT VÍCE INFORMACÍ

Matematika & statistika pro data science

Vybuduj základy pro kariéru v datové analýze a strojovém učení

O kurzu:

Kurz je vhodný pro:

Jan Kohout

Program

Úvod, základy jazyka Python, základní knihovny

První kroky při analýze dat

Základy pravděpodobnosti

Náhodné veličiny

Modelování pravděpodobnosti, detekce anomálií

Odhadování parametrů, testování hypotéz

Klasifikace a regrese – učení, příprava dat, metody

Vyhodnocení a porovnávání klasifikátorů

Regrese – metody, vyhodnocení

Reprezentace dat, generativní modely (přehledově)

Postup při řešení úlohy, shrnutí, zadání závěrečného úkolu

Workshop a diskuze s lektorem o závěrečném projektu, Q&A, pracovní trh

Získat více informací

Vybuduj základy pro kariéru
v datové analýze a strojovém učení