Aprendizaje Automático y Análisis de Datos

Información Básica

  • Créditos: 3
  • Horas de trabajo acompañado: 5 / semana (3 horas clase, 2 horas taller)
  • Horas de trabajo independiente: 4 / semana
  • Pre-requisitos: Estadística, Análisis y Diseño de Algoritmos, Probabilidad
  • Tipo de curso: Énfasis

Descripción del Curso

Este curso profundiza en las técnicas de aprendizaje automático que se utilizan para hacer análisis de datos. En particular se estudian las técnicas computacionales que aprovechan grandes volúmenes de datos para identificar regularidades o patrones de interés, también las que permiten encontrar agrupamientos naturales de los datos, hacer predicciones con base en información histórica o visualizar tendencias o comportamientos en los sistemas que generan los datos.

Objetivos

Al finalizar el curso los participantes podrán:

  • Identificar preguntas que pueden ser contestadas usando técnicas de aprendizaje automático sobre conjuntos de datos.
  • Aplicar variadas técnicas de aprendizaje automático a tareas específicas para responder preguntas de interés.
  • Interpretar los resultados obtenidos por las técnicas computacionales a la luz del contexto de la tarea a resolver.
  • Evaluar el desempeño de las técnicas computacionales aplicadas.
  • Comparar el desempeño de diversas técnicas y recomendar aquella o aquellas que mejor se adecúan a la tarea a resolver.

Se desarrollan competencias en

  • Solución creativa de problemas computacionales
  • Pensamiento crítico
  • Comunicación oral y escrita

Contenido

Capítulo 1: Introducción

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
1 1,5 1 Definición y ejemplos de una variedad de aplicaciones del aprendizaje automático Uso [1 caps 1]
2 1,5 1 Tipos de aprendizaje: supervisado, no supervisado, por refuerzo Uso [1 caps 1, 2]
3 1,5 1 Diseño de experimentos de entrenamiento y prueba: conjuntos de entrenamiento y prueba, estimación de parámetros, leave one out, validación cruzada Uso [2 caps 2, 5]
4 1,5 1 Desempeño de clasificadores: métricas, curvas ROC Uso [6 caps 2]
5 1 1,5 Práctica sobre diseño de experimentos Uso
6 1 1,5 Práctica sobre evaluación del desempeño Uso

Total de Horas: 15.

Capítulo 2: Aprendizaje estadístico

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
7 1,5 1 Regresión lineal Uso [2 caps 3]
8 1,5 1 Regresión logística, análisis discriminante lineal Uso [2 caps 4]
9 1,5 1 Análisis discriminante cuartico, método de los vecinos más cercanos Uso [2 caps 4]
10 1,5 1 Estimación de parámetros por máxima verosimilitud Uso [2 caps 4]
11 1,5 1 Remuestreo y selección de características Uso [2 caps 5]
12 1,5 1 Manejo de datos de alta dimensionalidad Uso [2 caps 6]

Total de Horas: Valor 15.

Capítulo 3: Aprendizaje supervisado

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
13 1,5 1 Aprendizaje de árboles de decisión Familiaridad [1 caps 3]
14 1,5 1 Redes neuronales artificiales Uso [1 caps 4][4 caps 5]
15 1,5 1 Redes neuronales artificiales Uso [1 caps 4][4 caps 5]
16 1,5 1 Máquinas de vectores de soporte Uso [2 caps 9]
17 1 1,5 Implementación de métodos de aprendizaje supervisado Uso
18 1 1,5 Comparación entre métodos de aprendizaje supervisado Evaluación

Total de Horas: 15.

Capítulo 4: Aprendizaje no supervisado

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
19 1,5 1 Análisis de componentes principales Uso [2 caps 10]
20 1,5 1 Métodos jerárquicos Uso [2 caps 10]
21 1,5 1 Métodos basados en centroide Uso [2 caps 10][4 caps 9]
22 1,5 1 Mapas autoorganizados Uso
23 1 1,5 Comparación entre métodos de aprendizaje no supervisado Evaluación

Total de Horas: 12,5.

Capítulo 5: Aprendizaje de modelos gráficos

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
24 1,5 1 Redes de Bayes Uso [4 caps 8]
25 1,5 1 Inferencia en redes de Bayes Familiaridad [4 caps 8]
26 1,5 1 Inferencia en modelos ocultos de Markov Familiaridad [4 caps 8]
27 1,5 1 Algoritmo EM (Expectation – maximization) Familiaridad [4 caps 8]

Total de Horas: 10.

Capítulo 6: Análisis de datos

Sesión Horas teóricas Prácticas acompañadas Temas Profundidad Bibliografía
28 1,5 1 Análisis de datos en negocios Familiaridad
29 1,5 1 Análisis de datos en bioinformática Familiaridad
30 1,5 1 Análisis de datos sobre grafos Familiaridad
31 1,5 1 Visualización de datos Familiaridad
32 1 1,5 Examen parcial

Horas**: 12,5.

Uso de material en exámenes

Asistencia

Bibliografía

  1. Machine learning. Tom Mitchell. McGraw Hill. 1997
  2. Introduction to statistical learning with applications in R. 6a impresión. 2015.
  3. The elements of statistical learning. Trevor Hastie et al. Springer. Second Edition. 2009.
  4. Pattern recognition and machine learning. Christopher Bishop. Springer. 2006.
  5. Artificial Intelligence a moder approach. Stuart Russell, Peter Norving. Pearson. Third edition. 2009.
  6. Pattern classification. Richard Duda et. al. Second edition. 2000.

Instalaciones

Salón de clase con computador y proyector. Laboratorio de Ingeniería de Sistemas y Computación.

Material de este semestre