Inferencia de media poblacional en R. Estudiante desvelado 👨🏻💻
¿Cómo inferir el valor de la media de una población?
Introducción al problema
- En este vídeo, se aborda cómo inferir el valor de la media de una población con un nivel de confianza específico. Un profesor realiza dos preguntas a sus alumnos sobre sus horarios de sueño.
Recolección y análisis de datos
- El profesor recolecta datos apareados sobre las horas que duermen 24 estudiantes, obteniendo promedios como 7.75 y 8.5 horas.
- Se plantea la pregunta sobre si los estudiantes duermen en promedio 8 horas, destacando la importancia de tener una muestra representativa para realizar inferencias.
Visualización de datos
- Se menciona el uso de la biblioteca
ggplot2en R para graficar los datos recopilados, indicando cómo instalarla si no está disponible.
- Se explica cómo crear un data frame en R que contenga un índice y las horas de sueño, preparando los datos para su visualización.
Análisis estadístico
- Se utiliza un gráfico tipo "point" para visualizar las horas dormidas por cada estudiante, facilitando el análisis visual.
- Se crea un nuevo vector que clasifica a los estudiantes según si duermen menos o más de 8 horas, lo cual es útil para construir una tabla de contingencia.
Cálculo del estadístico de prueba
- Se introduce la fórmula del estadístico de prueba: raíz cuadrada del tamaño muestral multiplicado por la diferencia entre la media muestral y la media poblacional hipotética.
- La normalidad en los datos es crucial; se decide eliminar un outlier (un registro anómalo), asegurando así que los resultados sean válidos.
Formulación y evaluación de hipótesis
- Se establecen las hipótesis nula (media = 8 horas) y alternativa (media ≠ 8 horas), fijando un nivel de confianza del 90%.