Video 1 ETL Clientes
Proceso de Extracción y Transformación de Datos
Introducción al Proceso
- En este primer vídeo se presenta un proceso de extracción de información y carga de datos utilizando archivos CSV y Excel.
- Se menciona la opción en Power BI para importar directamente archivos desde la pestaña de datos, eligiendo el archivo con el que se desea trabajar.
Carga y Previsualización de Datos
- Al cargar un archivo, se muestra una ventana previa con las columnas del archivo; sin embargo, solo se visualizan 200 filas inicialmente.
- Se discute la importancia de identificar qué columnas son útiles para modelar procesos específicos, como en este caso, un proceso de ventas.
Transformación y Limpieza de Datos
- Es crucial verificar los tipos de datos en las columnas, ya que pueden no ser correctos. Se deben eliminar las columnas innecesarias.
- Se explica que Power BI realiza tres pasos iniciales: carga del origen del archivo, promoción de encabezados y detección automática del tipo de dato.
Configuración Regional y Tipos de Datos
- La función "encabezados promovidos" transforma el primer renglón en nombres para las columnas.
- El tipo cambio identifica automáticamente si los datos son numéricos o textuales; es importante revisar estas transformaciones manualmente.
Ejemplo Práctico: Ajuste a Formato Mexicano
- Un ejemplo muestra cómo transformar fechas desde formato americano a mexicano mediante configuración regional.
- Para cambiar la configuración regional a inglés (EE.UU.), se debe seleccionar esta opción para asegurar que las fechas sean interpretadas correctamente.
Eliminación y Modificación de Columnas
- Se puede eliminar columnas innecesarias usando combinaciones como Ctrl + clic para seleccionar múltiples columnas antes de eliminarlas.
Transformaciones de Datos en Excel
Modificación y Transformación de Columnas
- Se discute la importancia de transformar columnas en Excel, mencionando opciones como "formar" o "agregar" columnas. La transformación implica cambiar una columna existente mediante operaciones específicas.
- Se sugiere modificar datos extrayendo información y realizando cálculos numéricos básicos, como multiplicaciones y divisiones.
- Se recomienda crear columnas condicionales para simplificar datos binarios (sí/no), facilitando el análisis computacional.
Creación de Columnas Condicionales
- Para crear una columna condicional, se accede a la pestaña "agregar columna", donde se puede nombrar la nueva columna y establecer condiciones específicas.
- Un ejemplo práctico incluye asignar un valor de 1 si se tiene casa (sí) y 0 si no (no), permitiendo así una representación más clara de los datos.
Transformación de Tipos de Datos
- Se menciona que es posible cambiar el tipo de dato en las nuevas columnas para que los valores aparezcan como "verdadero" o "falso" en lugar de 1 o 0, mejorando la legibilidad.
- Al eliminar columnas innecesarias, se optimiza el conjunto de datos manteniendo solo la información relevante tras las transformaciones realizadas.
Renombramiento y Configuración Adicional
- El renombramiento de columnas se realiza fácilmente con un doble clic sobre el nombre actual, lo que permite personalizar aún más los datos presentados.
- Se propone agregar otra columna condicional basada en diferentes criterios, como estado civil, para enriquecer el análisis sin complicar excesivamente los datos.
Actualización Automática del Archivo
¿Cómo realizar transformaciones en datos?
Proceso de Transformación de Datos
- Se menciona que los pasos de transformación pueden cambiar debido a la detección de errores o datos faltantes, lo que requiere ajustes no contemplados inicialmente.
- Al estar satisfechos con las transformaciones actuales, se puede actualizar el proceso para que corra de manera semi automática, facilitando la persistencia en los procesos CTL.
- Power BI ayuda a extraer información desde archivos externos, como CSV, y transforma estos datos para cargarlos en una tabla dentro del sistema.
- Para realizar modificaciones, se puede pasar el mouse sobre los elementos y seleccionar opciones de edición; esto permite analizar y ajustar los pasos realizados previamente.