Machine learning a data mining 1 [ KMI/MLDM1 ]
Předmět je první částí dvousemestrálního kurzu věnovaného principům a hlavním metodám získávání znalostí z dat (data mining) a strojového učení (machine learning). Po úvodu do problematiky s vymezením těchto pojmů a rozboru dat a jejich předzpracování jsou, z algoritmického hlediska, probírány základní data mining metody klasifikace, asociační analýzy a shlukování využívané (nejen) pro machine learning.
Zkouška
- požadované znalosti dány seznamem přednášek, přesněji odpřednášenou látkou a obsahem slajdů k přednáškám
- průběh ústním zodpovězením vylosovaných otázek s písemnou přípravou
Materiály
Přednášky
- Úvod:
Data mining: získávání znalostí z dat, KDD, typické úlohy. Strojové
učení: učení ze znalostí z dat, fáze a typy.
slajdy - Data:
Typy dat a atributů, kvalita a předzpracování (vzorkování, normalizace, diskretizace),
podobnost a nepodobnost objektů, souhrnné statistiky a vizualizace.
slajdy - Klasifikace:
Rozhodovací stromy, problém přeučení, vyhodnocení výkonnosti,
pravidlová (rule-based), nejbližší soused, naivní bayesovská, support vector
machines (SVM), regrese.
slajdy - Asociační analýza:
Itemsets, pravidla, algoritmus Apriori, vyhodnocení zajímavosti.
slajdy - Shlukování:
Typy shluků, K-means, hierarchické, hustotové (density-based),
expectation-maximization (EM), vyhodnocení kvality.
slajdy
Cvičení
Literatura
- Tan P.-N., Steinbach M., Kumar V.: Introduction to Data Mining. Pearson Education, 2005.
- Marsland S.: Machine Learning: An Algorithmic Perspective, 2nd ed. Chapman and Hall/CRC, 2014.
- Zaki M. J., Meira W. Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Poole D. L., Mackworth A. K.: Artificial Intelligence: Foundations of Computational Agents, 2nd ed. Cambridge University Press, 2017.