Información Básica
-
Profesor: Gloria Inés Alvarez V., María Constanza Pabón B.
-
Créditos: 4
-
Horas de Clase: 3/semana
-
Horas de trabajo independiente: 12/semana
-
Prerequisites: Habilidad en programación de computadores, fundamentos de probabilidad discreta.
Descripción del Curso
El curso de Minería de Datos y Descubrimiento del Conocimiento recopila métodos y técnicas relacionadas con los fundamentos de la minería de datos, tanto desde el punto de vista de las bases de datos como desde el aprendizaje automático. Se estudian los algoritmos que existen para realizarla, el proceso de descubrimiento de conocimiento y los problemas más comunes que surgen al realizar una aplicación para una tarea específica.
Metodología
El curso contará con clases expositivas para explicar las técnicas y asignaciones para realizar la práctica usando diversas herramientas. Los estudiantes desarrollarán un proyecto sobre un caso de aplicación dado.
Contenido
Sesiónes | Tema | Bibliografía |
---|---|---|
1 | Introducción – Motivación, definiciones, tareas y técnicas de la minería de datos |
[1], [4] |
2 | Manejo de Datos – Tipos de datos, calidad, medidas de similitud y estadísticas |
[1], [4] |
3 | Visualización de información – Visualización de datos numéricos, de datos no numéricos, dashboards |
[1], [4] |
4 | Bodegas de datos – Conceptos, Diseño, Modelo multidimensional, Análisis Metodología CRISP-DM |
|
5 | Evaluación | |
6 7 8 9 |
Clasificación – Árboles de decisión: conceptos, algoritmos – Clasificación basada en reglas, vecino más próximo, overfitting – Redes neuronales artificiales – Clasificadores bayesianos, support vector machine |
[1] |
10 | Estimación del error Comparación de técnicas Sistemas híbridos |
[1] |
11 | Evaluación | |
12 13 |
Asociación – Conceptos. Algoritmo A-priori – Algoritmo FP-Growth |
[1] |
14 15 |
Clustering – Conceptos, Algoritmo K-means – Métodos jerárquicos |
[1] |
16 | Proyecto |
Evaluación
Porcentaje | |
---|---|
Exámen | 25% |
Taller 1 | 25% |
Tareas | 10% |
Proyecto Entrega 1 | 15% |
Proyecto Entrega 2 | 25% |
Bibliografía
-
Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to data mining. Pearson Addison Wesley, c2006.
-
Ian H. Witten, Eibe Frank and Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2011. (disponible en Science Direct)
-
Igor Kononenko, Matjaz Kukar. Machine Learning and Data Mining. Norwood Publishing, 2007.
-
Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, 2012.
-
Mohamed Zaki and Wagner Meira Jr. Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press, 2014.