Python es uno de los principales lenguajes existentes hoy en día para la realización de procesos de Inteligencia Artificial y Análisis de Datos. Sin embargo, para la realización de un proceso de análisis de datos es necesario realizar un correcto tratamiento de los datos para lograr que sean un input correcto para un sistema de Inteligencia Artificial.
En el presente curso se profundizará en el manejo de los datos, tanto de distintas tablas como en una misma tabla, así como en la mejora de la calidad de los datos, de forma que los alumnos adquieran los conocimientos necesarios para lograr que sus datos constituyan un input valido para un sistema de Inteligencia Artificial.
Este taller será impartido online a través de la plataforma de vídeo conferencia ZOOM.
Aforo limitado a 15 personas.
Programa
1. Unión de tablas:
a. Concatenación de tablas.
b. Unión de tablas en función de una o varias variables:
i. Left join
ii. Right join.
iii. Inner join.
iv. Outer join.
c. Ejercicios prácticos.
2. Modificaciones avanzadas:
a. Selección de elementos únicos.
b. Transformación de caracteres de forma individualizada.
c. Transformación de caracteres de forma masiva.
d. Transformación del formato de las variables.
e. Ejercicios prácticos.
3. Transformación de tablas:
a. Agregaciones simples.
b. Agregaciones compuestas.
c. Verticalización de tablas.
d. Normalización de tablas.
e. Ejercicios prácticos.
4. Filtrados:
a. Eliminación de duplicados.
b. Filtrado por valores.
c. Filtrado por otra tabla.
d. Filtrado por las observaciones de otra tabla.
e. Selección de elementos diferentes.
f. Filtrado por los valores de una variable de otra tabla.
g. Ejercicios prácticos.
5. Tratamiento de valores perdidos:
a. Definición y problemas de su no tratamiento.
b. Eliminación de las observaciones.
c. Imputación de estadísticos básicos: media, mediana y moda.
d. Métodos de imputación múltiple (MICE).
e. Ejercicios prácticos.
6. Outliers:
a. Definición.
b. Problemas de su no tratamiento.
c. Eliminación de las observaciones
d. Determinación de los outliers.
e. Transformación de los outliers.
f. Creación de nuevas variables dummy.
g. Ejercicios prácticos.
7.Tratamiento de valores perdidos:
a. Definición.
b. Eliminación de las observaciones.
c. Imputación de estadísticos básicos: media, mediana y moda.
d. Métodos de imputación múltiple (MICE).
e. Modelos para imputar variables.
f. Ejercicios Prácticos