MES/IA-MOD9-UNIDAD4

MES/IA-MOD9-UNIDAD4

Introducción a Orange y su Aplicación en Investigación

Presentación de la Sesión

  • La sesión se dividirá en dos partes: una introducción a Orange y una práctica interactiva.
  • Se espera que los participantes aprendan a manejar herramientas útiles para sus investigaciones.

Uso de Herramientas Digitales

  • Se compartirá un enlace en WhatsApp para que los participantes puedan acceder al contenido mostrado en pantalla.
  • Los asistentes podrán navegar por diferentes secciones como formación, experiencia académica y laboral.

Explorando el Modelo Zin

Características del Modelo

  • El modelo Zin permite crear páginas web personales y otros productos digitales, facilitando el diseño sin necesidad de codificación compleja.
  • Es un modelo multimodal que puede adaptarse a diferentes plataformas siempre que se mantenga el entorno adecuado.

Aplicaciones Prácticas

  • Los usuarios pueden fusionar conocimientos para crear proyectos educativos, como "web quests", utilizando este modelo.
  • Se enfatiza la facilidad de interacción automatizada, lo cual simplifica procesos que normalmente requieren programación avanzada.

Desarrollo de Proyectos con Orange

Instrucciones Iniciales

  • Los participantes deben abrir Orange y crear un nuevo proyecto titulado "prueba de hipótesis".
  • Se anima a todos a trabajar interactivamente para replicar el mismo producto durante la sesión.

Comprobación de Hipótesis

  • Se discutirá cómo comprobar hipótesis utilizando herramientas estadísticas como SPSS, incluyendo pruebas específicas según la distribución normal de los datos.
  • La sesión abordará cómo utilizar Excel junto con widgets en Orange para facilitar este proceso investigativo sin complicaciones adicionales.

Cómo realizar una presentación sobre comprobación de hipótesis

Objetivos y recursos de la clase

  • El objetivo principal es aplicar machine learning utilizando modelos predeterminados de Orange para analizar datos categóricos provenientes de un cuestionario, interpretarlos con GPT y presentar un informe para una tesis.
  • Se utilizarán recursos como data categórica, el software no code Orange y un modelo de informe para la presentación.

Transformación de variables

  • El primer paso en el procedimiento es transformar variables categóricas a numéricas. Esto es esencial para el análisis posterior.
  • La muestra representativa se establece en 378 sujetos después de descontar encabezados del archivo Excel compartido.

Variables categóricas y su interpretación

  • Las preguntas del cuestionario utilizan una escala tipo Likert con cinco niveles, lo que permite clasificar las respuestas en categorías comprensibles para los encuestados.
  • Las variables categóricas son esenciales porque permiten a los sujetos elegir entre opciones claras, facilitando así la recolección de datos.

Conversión a variables numéricas

  • Para optimizar resultados en hipótesis, se asignan valores numéricos a las categorías: "nunca" = 1, "casi nunca" = 2, "a veces" = 3, "casi siempre" = 4 y "siempre" = 5.
  • También se asignan valores al género: masculino = 1 y femenino = 2. Esta conversión es crucial para el análisis estadístico.

Uso del Excel para la transformación

  • En Excel, se habilitan filtros para facilitar la selección y transformación de datos. Es importante verificar que los filtros estén activos.
  • Al filtrar por género masculino, se desmarcan todas las otras opciones antes de asignar el valor correspondiente (1). Este proceso ahorra tiempo al evitar modificaciones manuales uno por uno.

Cómo realizar conversiones de datos en Excel

Proceso de Pintado y Conversión de Datos

  • Se inicia el proceso pintando una celda específica, donde se observa una crucecita negra. Al hacer doble clic, se convierte automáticamente la categoría seleccionada a "Femenino" con un valor asignado de dos.
  • Es importante borrar el filtro después de realizar todas las conversiones para habilitar las 378 muestras disponibles. Esto asegura que los datos estén completamente visibles y accesibles.

Limpieza y Selección de Datos

  • Se realiza un filtrado para seleccionar categorías específicas como "a veces", asegurándose que no haya datos sucios en la selección. La limpieza es crucial para mantener la integridad del análisis.
  • Se repite el proceso con otras categorías como "casi nunca", "casi siempre" y "siempre", cada una con valores específicos asignados (2, 4 y 5 respectivamente). Este método sistemático permite convertir variables categóricas en numéricas.

Estructuración del Cuestionario

  • Una vez completadas las conversiones, se procede a trabajar desde la columna E hasta la K, estableciendo un tiempo límite de cuatro minutos para completar esta tarea.
  • Un participante solicita compartir una tabla que enumere los ítems por orden, lo cual es fundamental para seguir el procedimiento correctamente.

Finalización del Trabajo

  • Después de unos minutos adicionales, se confirma que todos han terminado o están cerca de finalizar su trabajo. El instructor está listo para continuar con la siguiente fase del proceso.
  • Se establece que todos deben tener sus datos listos antes de avanzar al siguiente paso en el análisis.

Cambio y Organización de Ítems

  • Los participantes deben cambiar los nombres de los ítems eliminando las preguntas originales y reemplazándolas por etiquetas como "ítem uno". Esto simplifica el cuestionario al enfocarse solo en los números.
  • Se explica cómo arrastrar celdas para replicar cambios rápidamente desde el ítem 1 hasta el ítem 8, facilitando así la organización del cuestionario.

Dimensiones e Indicadores

  • En este punto se introduce la idea de construir un cuadro con dimensiones e indicadores. Cada dimensión corresponde a varios ítems o preguntas dentro del cuestionario.
  • La lógica detrás del cálculo total por dimensión implica sumar los resultados individuales (ítem 1 + ítem 2), lo cual proporciona un total representativo para cada dimensión analizada.

Visualización y Coloración

  • Se instruye a los participantes sobre cómo visualizar sus dimensiones utilizando colores diferentes: verde para tres primeros ítems, azul para otros tres e naranjas para los últimos dos. Esta técnica ayuda a organizar visualmente los datos.
  • Finalmente, se enfatiza que cada dimensión debe ser igual a sus respectivos indicadores; esto refuerza la conexión entre las preguntas originales y su representación numérica en Excel.

¿Cómo se mide la variable dependiente en un estudio?

Introducción a las variables

  • Se establece que el total pretest (pret) es fundamental para medir la variable dependiente, mientras que la variable independiente representa el problema a investigar.
  • La hipótesis busca determinar si hay cambios en el problema mediante la medición de la variable dependiente.

Definición de Pretest y Postest

  • El pretest se realiza al inicio del estudio, donde se evalúa la variable dependiente antes de implementar cualquier intervención.
  • Se explica cómo calcular los totales en una columna utilizando herramientas como Excel, enfatizando la importancia de sumar los ítems del cuestionario.

Proceso de Medición

  • Al realizar el pretest, se organizan los datos por dimensiones y colores para facilitar su análisis. Los resultados numéricos son más relevantes que las categorías.
  • Se instruye sobre cómo obtener el total de sujetos evaluados en el pretest, destacando que este procedimiento es esencial para entender los resultados.

¿Qué sucede durante el Postest?

Implementación del Postest

  • En el postest, se vuelve a aplicar el mismo cuestionario a los mismos sujetos después de un periodo determinado (15 o 30 días).
  • Se compara cómo han cambiado las respuestas entre el pretest y postest, lo cual es crucial para evaluar la efectividad de cualquier intervención realizada.

Análisis Comparativo

  • Es importante convertir las categorías a valores numéricos para facilitar comparaciones entre pretest y postest.
  • Generalmente, se espera que los resultados del postest muestren una mejora respecto al pretest; sin embargo, pueden existir excepciones.

Ejemplo Práctico

  • Se presenta un ejemplo práctico donde se asume que todos los resultados han mejorado tras aplicar cambios hipotéticos en las respuestas.
  • Los participantes deben ajustar sus datos en función de estos cambios hipotéticos para observar tendencias y variaciones significativas.

Comprobación de Hipótesis y Carga de Datos en Orange

Preparación para la Comprobación de Hipótesis

  • Se requiere únicamente las columnas L y M, que representan los totales pre y postex. Estas columnas se derivan de los totales previos y posteriores.
  • Es importante notar el cambio entre los datos pre y post. La información debe ser organizada en una nueva hoja para facilitar su carga en el software Orange.

Organización de Datos en Excel

  • Se sugiere copiar solo los ítems y totales necesarios desde la hoja actual a un nuevo archivo Excel, asegurando que esté limpio.
  • El archivo debe incluir género, ocho ítems, así como los valores pred (pretest) y post (postest). No es necesario incluir fórmulas complejas.

Carga de Datos en Orange

  • Al cargar datos en Orange, es crucial eliminar cualquier cabecera o contenido adicional que no sea necesario para el análisis.
  • Los usuarios deben cerrar el archivo Excel después de guardar sus cambios antes de proceder a cargarlo en Orange.

Configuración del Widget File

  • En Orange, se utiliza el widget "file" para cargar la hoja de Excel previamente preparada. Este paso es esencial para iniciar el procesamiento.
  • Es fundamental identificar correctamente el tipo y rol de cada variable: numéricas o categóricas. Esto afecta cómo se interpretarán los datos durante el análisis.

Definición del Rol de Variables

  • Las variables deben clasificarse adecuadamente; por ejemplo, los ítems son numéricos mientras que edad y género son considerados información adicional.
  • El rol 'target' se asigna al postest ya que este será comparado con el pretest. Esta distinción es clave para entender la estructura del análisis.

Verificación Final de Datos

  • Una vez configuradas las variables, se debe aplicar la configuración antes de continuar con la visualización.
  • Para verificar que todos los datos sean correctos, se utiliza el widget "data tape", permitiendo confirmar que todo está listo para avanzar con el análisis.

Procedimiento de Carga y Visualización de Datos

Carga del Dataset Numérico

  • Se ha completado el proceso de carga del dataset numérico, utilizando la configuración del widget para verificar la tabla correcta.
  • Se utiliza el widget "Select Columns" para conectar el input al data tape y configurar las columnas seleccionadas.

Configuración del Widget Select Columns

  • En la sección de transformación, se arrastra el widget "Select Columns" a la hoja de trabajo y se establece la conexión adecuada.
  • Se deben seleccionar las columnas desde "ítem uno" hasta "pretext", organizando los datos en el cajón objetivo (target).

Proceso Adicional con Target

  • En target, se debe identificar y seleccionar "postex", además de incluir información adicional como número y género.
  • Es importante seguir esta secuencia para asegurar que todos los datos estén correctamente organizados.

Visualización con Diagramas

Uso del Widget Diagram

  • Se procede a utilizar el widget "Diagram" conectándolo al widget "Select Columns".
  • La configuración del widget incluye establecer conexiones entre las columnas seleccionadas y preparar visualizaciones adecuadas.

Configuración de Gráficas

  • En la primera columna se debe colocar "total pret", mientras que en la parte derecha se selecciona "total postex".
  • Al finalizar, se espera obtener una gráfica que represente correctamente los datos seleccionados.

Verificación y Análisis Estadístico

Confirmación de Resultados

  • Se solicita confirmación sobre si todos han logrado generar sus gráficas correctamente.

Importancia de los Datos Estadísticos

  • Se destaca la relevancia de observar cuántos son los datos representativos según lo elaborado en Excel.
  • El valor de significancia obtenido es crucial para tomar decisiones informadas respecto a las variables dependientes analizadas.

¿Cómo interpretar el valor de significancia en la investigación?

Conceptos básicos sobre el valor de significancia

  • El valor P, que representa la "porancia", se establece en 0.00 según los datos obtenidos. Este es un indicador clave en las pruebas estadísticas.
  • La regla principal indica que si el valor de significancia (P) es mayor a 0.05, no se rechaza la hipótesis nula, lo que sugiere que los resultados no son estadísticamente significativos.
  • Si P es menor a 0.05, se debe rechazar la hipótesis nula y considerar que los resultados son estadísticamente significativos.

Aplicación de las reglas

  • Se plantea una pregunta crucial: ¿qué regla seguir con un resultado específico? En este caso, dado que P = 0.00 (menor a 0.05), se rechaza la hipótesis nula y se acepta la alterna.
  • La comprobación de hipótesis se ha realizado correctamente al determinar que el modelo de tutoría virtual inteligente influye en los trabajos de grado.

Redacción del informe

  • Es importante estructurar adecuadamente las hipótesis en el documento: presentar tanto la hipótesis alterna como la nula para clarificar el enfoque del investigador.
  • Se menciona cómo medir variables independientes y dependientes para evaluar su influencia en el contexto específico de estudiantes de últimos semestres.

Interpretación y análisis gráfico

  • Para verificar distribuciones normales, se deben utilizar modelos adecuados como diagramas CP y presentar gráficos relevantes con sus respectivas etiquetas.
  • La interpretación debe ser clara; resumir las hipótesis y utilizar herramientas como GPT para facilitar esta tarea puede ser útil.

Conclusiones finales

  • Al finalizar, es esencial organizar toda la información recopilada en párrafos coherentes, asegurando que cada parte esté alineada con las variables estudiadas.
  • Se concluye rechazando la hipótesis nula basándose en los resultados obtenidos, reafirmando así su significado estadístico significativo dentro del estudio.

¿Qué es la correlación y cómo utilizarla en Orange?

Introducción a la correlación

  • Se presenta el concepto de correlación, que se conecta con el uso del widget de correlación en Orange.
  • Se explica cómo conectar el widget de correlación al canvas, utilizando "select columns" para seleccionar las columnas relevantes.

Configuración del widget de correlación

  • Se menciona la importancia de tener una vista correcta tras configurar el widget, comparando resultados con los participantes.
  • El instructor guía a los participantes para arrastrar el widget de correlación al canvas y realizar un doble clic para acceder a la configuración.

Selección del objetivo

  • Se enfatiza en seleccionar correctamente el objetivo (total postex) y observar los ítems relacionados, destacando un valor alto de 0.98.
  • La configuración debe mostrar "total poste" arriba y todos los ítems trabajados abajo.

Prueba de correlación

  • Se introduce la prueba de correlación RH Spearman, mencionando que se trabaja con 378 elementos y se obtiene un resultado específico.
  • Los participantes deben hacer un recorte del área relevante en Orange para incluirlo en su informe.

Visualización con Scarlet Plot

  • Se instruye sobre cómo utilizar el widget Scarlet Plot para visualizar los datos obtenidos.
  • Es crucial conectar correctamente los datos entre el widget de correlación y Scarlet Plot, asegurándose que sea data-data.

Configuración final del gráfico

  • En esta etapa se seleccionan las variables adecuadas para los ejes X (pretest) e Y (posttest), así como definir colores según edad.
  • La gráfica resultante puede mostrar valores cercanos a uno; se pide confirmación sobre estos valores entre los participantes.

Interpretaciones finales

  • Los participantes son guiados sobre cómo copiar sus resultados y gráficos para analizarlos posteriormente con GPT.
  • Se discute cómo interpretar el valor R obtenido, indicando una relación positiva entre puntajes iniciales altos y niveles logrados tras implementar un modelo educativo.

Modelo de Tutoría Virtual Inteligente y su Impacto en el Rendimiento Académico

Efectos del Modelo de Tutoría

  • El modelo de tutoría virtual inteligente se identifica como un predictor significativo del rendimiento en investigación para estudiantes de últimos semestres en la Universidad Blanca.
  • Se discute la relación entre eficacia pedagógica y metodológica, sugiriendo que los resultados pueden expresarse en términos porcentuales para facilitar la comprensión.

Comprobación de Hipótesis

  • La importancia de presentar claramente el valor de influencia del modelo sobre las variables investigadas es enfatizada, especialmente ante un tribunal académico.
  • Un ejemplo concreto muestra que un 98.8% puede ser el resultado obtenido, lo cual es crucial para validar la hipótesis alternativa frente a la nula.

Herramientas y Métodos

  • Se menciona que existen métodos más simples y directos para realizar análisis estadísticos comparados con técnicas tradicionales como SPSS.
  • La clase incluye una interpretación sencilla que cierra el capítulo sobre comprobación de hipótesis, destacando la posibilidad de generar algoritmos para evidenciar ítems.

Análisis Avanzado

  • Se introduce el concepto de cadenas trick para hacer predicciones dentro del marco investigativo, aunque se aclara que esto no será cubierto en profundidad durante esta sesión.
  • Se menciona cómo se pueden visualizar predicciones mediante tablas y cadenas RAM, aunque estos temas son más avanzados y requerirían un curso específico.

Comparativa entre Métodos Tradicionales y Machine Learning

  • Se contrasta el uso tradicional de SPSS con enfoques modernos como machine learning, donde se simplifican procesos complejos a través del uso eficiente de Excel.
  • La centralización e identificación de distribuciones normales se realiza gráficamente, facilitando así la interpretación y prueba correlacional necesaria para validar hipótesis.

Cierre y Tareas Prácticas

  • Al final, se instruye a los participantes sobre cómo guardar sus proyectos correctamente utilizando formatos adecuados como WinRAR.
  • Se enfatiza la importancia de organizar adecuadamente los datos trabajados durante las sesiones prácticas para asegurar su accesibilidad futura.

Revisión de Proyectos y Carga de Datos

Instrucciones para la Carga de Archivos

  • El presentador solicita que se carguen los archivos completos en el grupo de WhatsApp, enfatizando la necesidad del Excel y del proyecto para su revisión.
  • Se destaca que el proyecto debe ejecutarse correctamente; si no lo hace, es probable que falte información en el Excel. Se da un tiempo adicional para completar esta tarea.

Proceso de Revisión

  • El presentador comienza a cerrar la recepción de trabajos y menciona que revisará los proyectos uno por uno, comenzando con el proyecto de Paris Torres.
  • Un participante expresa dificultades con la configuración en Orange y problemas con las gráficas debido a falta de datos. Se compromete a revisar el video para corregir errores.

Validación de Datos

  • Se inicia la revisión del proyecto Alarcón, donde se encuentra que falta información crucial (pre y post), lo cual es considerado un error grave.
  • El presentador valida los datos del proyecto Alarcón Rosario, confirmando que algunos elementos están correctos mientras otros son incompletos.

Análisis Detallado

  • La validación continúa con un enfoque en el Scarlet Plot; se verifica si todos los componentes funcionan como deberían.
  • En la revisión del trabajo de María Torres, se identifica que solo ha enviado un Excel incompleto, lo cual resulta inaceptable.

Conclusiones sobre Proyectos Presentados

  • Adriana Gareca presenta su trabajo, mostrando una mejor organización en sus datos. Sin embargo, también hay errores identificados en su carga.
  • Pablo enfrenta problemas similares al no haber configurado adecuadamente ciertos elementos necesarios para completar su presentación. Se recuerda a todos sobre la importancia de seguir las instrucciones dadas previamente.

Trabajo Final y Actividades

Instrucciones para el Trabajo Final

  • Se menciona que los colegas Arcón Rosario y Adriana Gareca tienen la puntuación directa de 40 puntos por su trabajo final, que consiste en cargar un archivo Excel.
  • El trabajo final incluye realizar un Excel con datos proporcionados, que serán "totalmente sucios", y llevar esos datos a un proyecto específico.
  • Los estudiantes deben presentar tres elementos: el archivo Excel, la data procesada y un informe en formato PDF como producto final del trabajo.

Actividad Cuatro

  • La actividad número cuatro consistirá en un cuestionario práctico sobre las sesiones anteriores. Se enfatiza que solo quienes hayan asistido podrán responder correctamente.

Habilitación de Actividades

  • Un estudiante solicita habilitar actividades del sistema debido a dificultades para completar tareas durante la semana.
  • El docente responde afirmando que todas las actividades se volverán a habilitar hasta el primero de febrero, permitiendo tiempo adicional para completarlas.

Uso de Herramientas Digitales

Introducción al Modelo de Trabajo

  • Se recomienda a los estudiantes acostumbrarse a trabajar con una nueva herramienta digital, cuyo enlace se ha compartido en el chat de Zoom.

Funcionalidades Avanzadas

  • Se presenta la versión más reciente (4.7) de una API optimizada para diversas tareas como diseño web, investigación profunda y codificación.

Ejemplo Práctico

  • El docente muestra cómo cargar su hoja de vida en formato PDF para crear una página web personal interactiva con secciones específicas.

Diseño Web Interactivo

  • Se destaca la importancia del diseño web interactivo para presentar información personal, enfatizando la necesidad de ser expertos en esta área.

¿Cómo utilizar modelos de IA para la codificación?

Introducción a los formatos y procesamiento

  • Se menciona la posibilidad de obtener formatos en HTML que permiten ejecutar sin conexión a internet, aunque el proceso puede tardar un poco.
  • El modelo tiene más recursos que otros como GPT, permitiendo ajustes en tiempo real mientras se procesa la información.

Interacción y ajustes en tiempo real

  • Es importante limpiar la caché del navegador para evitar problemas de rendimiento al interactuar con el modelo.
  • Se destaca cómo el modelo genera una vista inicial del perfil académico y permite realizar correcciones y adiciones fácilmente.

Ventajas del nuevo modelo sobre otros

  • Este modelo es considerado una tendencia actual, facilitando mucho el trabajo de codificación y generando productos útiles para herramientas como Visual Code.
  • Comparado con Gemini, este modelo ofrece mejores opciones para laboratorios y presentaciones didácticas, aunque cada uno tiene sus particularidades.

Razonamiento y optimización de modelos

  • Se discute la importancia del razonamiento en los modelos de IA, destacando que GPT 5.2 es uno de los más optimizados hasta ahora.
  • La efectividad del modelo depende de cómo se estructuran las preguntas; un enfoque metodológico es crucial para obtener respuestas coherentes.

Comparación entre diferentes modelos

  • Grock se posiciona alrededor del 50% en términos de razonamiento, mientras que Claude está por debajo del 40%, siendo útil principalmente para codificación.
  • Chat Z presenta características interactivas únicas no disponibles en otros modelos como Claude o GPT, lo que permite crear escenarios dinámicos.

Conclusiones finales

  • La elección del modelo adecuado depende del tipo de tarea a realizar; combinar diferentes herramientas puede resultar en un producto final superior.
  • Se cierra la sesión agradeciendo a los participantes e invitándolos a mantenerse al día con las actividades programadas.

Reflexiones y Consultas sobre el Módulo

Agradecimientos y Aprendizajes

  • Se expresa gratitud hacia el doctor por la enseñanza recibida en el módulo, destacando que se ha aprendido mucho de él.
  • El agradecimiento es reiterado, mostrando un fuerte aprecio por la dedicación del docente.

Consulta sobre Herramientas Utilizadas

  • Un participante solicita información sobre la pizarra virtual utilizada durante las clases, indicando interés en conocer más sobre las herramientas pedagógicas empleadas.