Regresión Lineal y Mínimos Cuadrados Ordinarios | DotCSV

Regresión Lineal y Mínimos Cuadrados Ordinarios | DotCSV

Introducción a la Regresión Lineal

¿Por qué estudiar regresión lineal?

  • El modelo de regresión lineal es fundamental para aprender estadística y machine learning, además de ser sencillo de comprender.
  • Se utilizará como base para entender conceptos que serán útiles en futuros vídeos sobre redes neuronales.

Contexto práctico

  • Se presenta un escenario donde un investigador busca vivienda y se pregunta sobre la relación entre el precio medio de las viviendas y el número de habitaciones.
  • A través de datos reales, se observa una tendencia: a mayor número de habitaciones, mayor es el valor de la vivienda.

Construcción del Modelo

Trazado de la línea

  • Al graficar los datos, se decide trazar una línea que represente esta tendencia, lo cual resulta en un modelo predictivo.
  • Este modelo permite predecir valores incluso para datos no observados, como el precio medio con 6.5 habitaciones.

Algoritmo automático

  • Se plantea la necesidad de un algoritmo que dibuje automáticamente esta línea a partir de los datos disponibles.

Matemáticas detrás del Modelo

Estructura matemática

  • En un espacio bidimensional, una recta se define por su término independiente (intersección con el eje Y) y su pendiente (inclinación).

Complejidad del mundo real

  • La realidad es más compleja; factores adicionales como criminalidad o cercanía a centros comerciales también afectan el valor de las viviendas.

Regresión Lineal Múltiple

Expansión del modelo

  • Introducir múltiples variables transforma el modelo simple en uno múltiple, donde se busca ajustar un plano en lugar de una línea.

Representación vectorial

  • Las características pueden representarse mediante matrices donde cada columna representa una variable y cada fila corresponde a mediciones específicas.

Eficiencia en Programación

Simplificación mediante vectores

  • Al usar notación vectorial, las ecuaciones son más elegantes y permiten entrenar modelos más eficientemente utilizando GPUs especializadas.

Aplicabilidad universal

Método de Cuadrados Ordinarios y su Aplicación

Introducción al Método

  • Se presenta el método de cuadrados ordinarios, que se basa en evaluar la calidad de un modelo a través del error entre los valores predichos y los reales.
  • El error se define como la distancia entre el valor predicho por el modelo y el valor real, lo que lleva a considerar una función de coste basada en estas distancias.

Función de Coste

  • La función de coste utilizada es el error cuadrático medio, donde se elevan al cuadrado las distancias para penalizar más fuertemente los errores mayores.
  • Cada área representada en la animación ilustra cómo se asigna el error a cada punto, sumando todos estos errores para encontrar la mejor recta.

Optimización del Modelo

  • Se busca manipular parámetros (pendiente e intercepto) para minimizar la suma de cuadrados. Esto implica derivar la función de coste y establecerla igual a cero.
  • Aunque no es necesario entender todas las ecuaciones, es crucial saber que hemos minimizado nuestra función de coste para obtener una ecuación clave que permite resolver nuestro problema.

Implementación Práctica

  • La ecuación resultante permite calcular automáticamente los valores óptimos de los parámetros utilizando matrices.
  • Sin embargo, este método puede ser ineficiente debido a la necesidad de invertir matrices, lo cual puede ser costoso computacionalmente.

Métodos Alternativos

  • Se introduce un segundo método iterativo llamado descenso del gradiente, que busca reducir progresivamente el error sin requerir fórmulas directas.
Video description

El primer modelo que vamos a estudiar es el Modelo de Regresión Lineal. Este es fundamental tanto para estadísticas como para Machine Learning, y además su estimación es muy sencilla. De los métodos que hay, uno es el método de Mínimos Cuadrados Ordinarios y otro es el de Descenso del Gradiente. Hoy veremos el primero de ellos. --- [Fe de errata] --- (thanks ProGallo) 4:55 - Falta la primera columna de 1s en la matriz X. 4:55 - No es W, sino W traspuesta. ¡Si localizas algún error en el vídeo, coméntalo y lo incluiré en este apartado! --- ¡MÁS DOTCSV! ---- 💸 Patreon : https://www.patreon.com/dotcsv 👓 Facebook : https://www.facebook.com/AI.dotCSV/ 👾 Twitch!!! : https://www.twitch.tv/dotcsv 🐥 Twitter : https://twitter.com/dotCSV 📸 Instagram : https://www.instagram.com/dotcsv/ --- ¡MI TECNOLOGÍA! ---- ** Aquí no está toda mi tecnología, sólo aquella que realmente recomiendo. Usando estos links de Amazon yo me llevaré una comisión por tu compra :) ** [Tecnología básica para Youtube] 💻 Portátil - MSI GP72 7RDX Leopard : https://amzn.to/2CDwvgY 📸 Cámara - Canon EOS 750D : https://amzn.to/2CDPqbi 👁‍🗨 Objetivo 1 - EF 50 mm, F/1.8 : https://amzn.to/2CH7npx 👁‍🗨 Objetivo 2 - EF-S 18-135mm : https://amzn.to/2DuhL5t 👁‍🗨 Objetivo 3 - EF 24 mm, F/2.8 : https://amzn.to/2AYAFQm 🎤 Microfono - Blue Yeti Micro : https://amzn.to/2RItA0I 💡 Foco Luz - Foco LED Neewer : https://amzn.to/2AYCM6K 🌈 Luz Color - Tira ALED Light : https://amzn.to/2B2iY2l [Mis otros cacharros] 📱 Smartphone - Google Pixel 2 XL : https://amzn.to/2RMuY2v -- ¡MÁS CIENCIA! --- 🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí: http://scenio.es/colaboradores #Scenio