Machine learning a data mining 1 [ KMI/MLDM1 ]

Předmět je první částí dvousemestrálního kurzu věnovaného principům a hlavním metodám získávání znalostí z dat (data mining) a strojového učení (machine learning). Po úvodu do problematiky s vymezením těchto pojmů a rozboru dat a jejich předzpracování jsou, z algoritmického hlediska, probírány základní data mining metody klasifikace, asociační analýzy a shlukování využívané (nejen) pro machine learning.

Zkouška

Společné informace ke zkoušce

Materiály

Přednášky

  1. Úvod: Data mining: získávání znalostí z dat, KDD, typické úlohy. Strojové učení: učení ze znalostí z dat, fáze a typy.
    slajdy
  2. Data: Typy dat a atributů, kvalita a předzpracování (vzorkování, normalizace, diskretizace), podobnost a nepodobnost objektů, souhrnné statistiky a vizualizace.
    slajdy
  3. Klasifikace: Rozhodovací stromy, problém přeučení, vyhodnocení výkonnosti, pravidlová (rule-based), nejbližší soused, naivní bayesovská, support vector machines (SVM), regrese.
    slajdy
  4. Asociační analýza: Itemsets, pravidla, algoritmus Apriori, vyhodnocení zajímavosti.
    slajdy
  5. Shlukování: Typy shluků, K-means, hierarchické, hustotové (density-based), expectation-maximization (EM), vyhodnocení kvality.
    slajdy

Cvičení

Na stránkách cvičícího.

Literatura