Jan Kohout
Senior Data Scientist
TruU
Ovládni svět dat s kurzem aplikované statistiky pro datovou vědu! Získej nejen teoretické znalosti, ale i praktické dovednosti, které ti poslouží jako základ pro strojové učení a datovou analýzu.
Propoj teorii s praxí v našem kurzu matematiky a statistiky pro datovou vědu! Nauč se analyzovat data s matematickou přesností a ovládni Python pro řešení reálných datových výzev. Získej praktické dovednosti v data science, od základních statistických konceptů až po pokročilé techniky analýzy dat.
Požadavky
K absolvování kurzu potřebuješ znát základy Pythonu, Javy, C# nebo jiného jazyka, základní pojmy z integrálního a diferenciálního počtu, metrických prostorů a základy pravděpodobnosti.
Kurz začíná
22. 1. 2024
Lektor
—> Přehled a cíle kurzu
—> Proč je matematika/statistika potřebná pro datovou analýzu
—> Základy Pythonu – proč Python, Jupyter Notebook, základní konstrukce, datové struktury a knihovny pro data science (numpy, MatPlotLib), conda/pip, odevzdávání úkolů
—> Knihovna Pandas, struktura DataFrame
—> Základní charakteristiky – průměr, modus, median, matice dat…
—> Vizualizace dat
Úkol: Načtení datasetu v Pandas, práce se sloupci a řádky, výběr a základní analýza dat
—> Pravděpodobnost, statistika, náhodné jevy, pravděpodobnostní prostor, (ne)závislost jevů
—> Empirický odhad pravděpodobnosti, histogram, vizualizace
—> Množiny – operace, Vennovy diagramy, vztah ke kombinatorice a pravděpodobnosti
—> Podmíněná pravděpodobnost, Bayesova věta, naivní Bayesovský klasifikátor (NBC)
—> Základní pojmy – distribuční funkce, rozdělení pravděpodobnosti, spojité x diskrétní veličiny
—> Charakteristiky náhodné veličiny – střední hodnota, rozptyl, entropie, korelace náhodných veličin
—> Vybraná známá rozdělení, náhodné generátory dat
Úkol: Empirický odhad pravděpodobnosti - vlastní implementace NBC
—> Připomenutí empirického odhadu pravděpodobnosti, vztah k histogramu a využití k odhadu distribuční funkce
—> „Kernel density estimation“ (KDE), vícerozměrná data
—> Odhad hustoty pravděpodobnosti pomocí k-nejbližších sousedů
—> Detekce anomálií na základě pravděpodobnosti, příklady
—> Bodový vs. intervalový odhad parametru, konfidenční interval
—> Odhad na základě maximální věrohodnosti
—> Centrální limitní věta
—> Statistické testy, p-hodnota, příklady
—> Rozdíl klasifikace vs. regrese, příklady klasifikátorů
—> Princip učení klasifikátorů, příprava trénovacích dat
—> Příklady klasifikátorů a jejich principy – připomenutí NBC, rozhodovací stromy, k-NN, lineární klasifikátor
—> Vyhodnocení kvality klasifikátoru, příprava testovacích dat
—> Křížová validace
—> ROC křivka – význam, sestavení, interpretace
—> Porovnání více klasifikátorů, vztah k testování hypotéz
Úkol: Vyhodnocení kvality klasifikátorů na vybrané klasifikační úloze
—> Příklady regresní analýzy – základní pojmy
—> Příklady metod – lineární regrese, logistická regrese
—> Učení, měření chyby
—> Reprezentace dat pro zpracování algoritmy klasifikace/regrese – vektorizace textových dokumentů, obrázků apod.
—> Učení reprezentací
—> Generování dat pomocí modelů – základní principy
Úkol: Závěrečná úloha.
—> Příklad řešení úlohy „od začátku do konce“, upozornění na problémy
—> Shrnutí kurzu
—> Zadání závěrečného úkolu
Vyplň registrační formulář a připoj se k nám!
Náš robot_dreams tým se s tebou spojí co nejdříve,
abys získal*a všechny potřebné detaily o obsahu kurzu a jeho ceně.