Online kurz Matematika a statistika pro datovou vědu – Pochop matematické a statistické koncepty | robot_dreams Czech
  • < živý online kurz >
  • < 12 lekcí >

Jan Kohout

Senior Data Scientist
TruU

Matematika & statistika pro data science

Vybuduj základy pro kariéru
v datové analýze a strojovém učení

Ovládni svět dat s kurzem aplikované statistiky pro datovou vědu! Získej nejen teoretické znalosti, ale i praktické dovednosti, které ti poslouží jako základ pro strojové učení a datovou analýzu.

Rezervuj si místo

O kurzu:

Propoj teorii s praxí v našem kurzu matematiky a statistiky pro datovou vědu! Nauč se analyzovat data s matematickou přesností a ovládni Python pro řešení reálných datových výzev. Získej praktické dovednosti v data science, od základních statistických konceptů až po pokročilé techniky analýzy dat.

Požadavky

K absolvování kurzu potřebuješ znát základy Pythonu, Javy, C# nebo jiného jazyka, základní pojmy z integrálního a diferenciálního počtu, metrických prostorů a základy pravděpodobnosti.

  • 12 online lekcí
  • Python a Jupyter Notebook
  • Knihovny pro data science

Kurz je vhodný pro:

Softwarové inženýry
  • Porozumíš matematickým a statistickým principům.
  • Naučíš se aplikovat matematické a statistické koncepty.
  • Získáš praktické zkušenosti s Pythonem a jeho knihovnami.
Junior datové analytiky
  • Pronikneš hlouběji do konceptů datové analýzy.
  • Naučíš se pracovat s reálnými příklady.
  • Efektivně využiješ nástroje pro analýzu a vizualizaci dat.

Připravujeme

Chci se přihlásit

Lektor

Jan Kohout

  • Senior Data Scientist ve startupu TruU, kde se věnuje využití umělé inteligence pro autentizaci uživatelů bez použití hesel.
  • Je absolventem teoretické informatiky na Matematicko-fyzikální fakultě UK a doktorského studia na FEL ČVUT se zaměřením na využití strojového učení pro zabezpečení počítačových sítí.
  • Ve společnosti Cisco Systems pracoval 9 let na návrhu algoritmů pro detekci anomálií, bezpečnostních incidentů a modelování chování za pomoci umělé inteligence.
  • Je (spolu)autorem odborných článků a patentů z oblasti využití strojového učení v bezpečnosti s několika stovkami citací.

Program

    • Lekce 1

    Úvod, základy jazyka Python, základní knihovny

    —> Přehled a cíle kurzu
    —> Proč je matematika/statistika potřebná pro datovou analýzu
    —> Základy Pythonu – proč Python, Jupyter Notebook, základní konstrukce, datové struktury a knihovny pro data science (numpy, MatPlotLib), conda/pip, odevzdávání úkolů

    • Lekce 2

    První kroky při analýze dat

    —> Knihovna Pandas, struktura DataFrame
    —> Základní charakteristiky – průměr, modus, median, matice dat…
    —> Vizualizace dat

     

    Úkol: Načtení datasetu v Pandas, práce se sloupci a řádky, výběr a základní analýza dat

    • Lekce 3

    Základy pravděpodobnosti

    —> Pravděpodobnost, statistika, náhodné jevy, pravděpodobnostní prostor, (ne)závislost jevů
    —> Empirický odhad pravděpodobnosti, histogram, vizualizace
    —> Množiny – operace, Vennovy diagramy, vztah ke kombinatorice a pravděpodobnosti
    —> Podmíněná pravděpodobnost, Bayesova věta, naivní Bayesovský klasifikátor (NBC)

    • Lekce 4

    Náhodné veličiny

    —> Základní pojmy – distribuční funkce, rozdělení pravděpodobnosti, spojité x diskrétní veličiny
    —> Charakteristiky náhodné veličiny – střední hodnota, rozptyl, entropie, korelace náhodných veličin
    —> Vybraná známá rozdělení, náhodné generátory dat

     

    Úkol: Empirický odhad pravděpodobnosti - vlastní implementace NBC

    • Lekce 5

    Modelování pravděpodobnosti, detekce anomálií

    —> Připomenutí empirického odhadu pravděpodobnosti, vztah k histogramu a využití k odhadu distribuční funkce
    —> „Kernel density estimation“ (KDE), vícerozměrná data
    —> Odhad hustoty pravděpodobnosti pomocí k-nejbližších sousedů
    —> Detekce anomálií na základě pravděpodobnosti, příklady

Zobrazit celý program Skrýt program
    • Lekce 6

    Odhadování parametrů, testování hypotéz

    —> Bodový vs. intervalový odhad parametru, konfidenční interval
    —> Odhad na základě maximální věrohodnosti
    —> Centrální limitní věta
    —> Statistické testy, p-hodnota, příklady

    • Lekce 7

    Klasifikace a regrese – učení, příprava dat, metody

    —> Rozdíl klasifikace vs. regrese, příklady klasifikátorů
    —> Princip učení klasifikátorů, příprava trénovacích dat
    —> Příklady klasifikátorů a jejich principy – připomenutí NBC, rozhodovací stromy, k-NN, lineární klasifikátor

    • Lekce 8

    Vyhodnocení a porovnávání klasifikátorů

    —> Vyhodnocení kvality klasifikátoru, příprava testovacích dat
    —> Křížová validace
    —> ROC křivka – význam, sestavení, interpretace
    —> Porovnání více klasifikátorů, vztah k testování hypotéz

     

    Úkol: Vyhodnocení kvality klasifikátorů na vybrané klasifikační úloze

    • Lekce 9

    Regrese – metody, vyhodnocení

    —> Příklady regresní analýzy – základní pojmy
    —> Příklady metod – lineární regrese, logistická regrese
    —> Učení, měření chyby

    • Lekce 10

    Reprezentace dat, generativní modely (přehledově)

    —> Reprezentace dat pro zpracování algoritmy klasifikace/regrese – vektorizace textových dokumentů, obrázků apod.
    —> Učení reprezentací
    —> Generování dat pomocí modelů – základní principy

     

    Úkol: Závěrečná úloha.

    • Lekce 11

    Postup při řešení úlohy, shrnutí, zadání závěrečného úkolu

    —> Příklad řešení úlohy „od začátku do konce“, upozornění na problémy
    —> Shrnutí kurzu
    —> Zadání závěrečného úkolu

    • Lekce 12

    Workshop a diskuze s lektorem o závěrečném projektu, Q&A, pracovní trh

Získat více informací

Vyplň registrační formulář a připoj se k nám!
Náš robot_dreams tým se s tebou spojí co nejdříve,
abys získal*a všechny potřebné detaily o obsahu kurzu a jeho ceně.

Povinné pole
ZÍSKAT VÍCE INFORMACÍ