¿Qué es el Descenso del Gradiente? Algoritmo de Inteligencia Artificial | DotCSV

¿Qué es el Descenso del Gradiente? Algoritmo de Inteligencia Artificial | DotCSV

Introducción al Descenso del Gradiente

Conceptos Básicos de Regresión Lineal

  • Se menciona que el modelo de regresión lineal se entrena a partir de datos utilizando el método de mínimos cuadrados para encontrar un punto mínimo en la función de coste.
  • El método de cuadrados ordinarios es limitado y se introduce el descenso del gradiente como un algoritmo clave en machine learning.

Funciones Convexas y No Convexas

  • La función de coste indica el error del modelo, y su forma puede ser convexa o no convexa. Las funciones convexas tienen un único mínimo global.
  • Se explica que las funciones cóncavas pueden transformarse en convexas, pero las funciones no convexas presentan múltiples mínimos locales, lo que complica su resolución.

Desafíos con Funciones No Convexas

Problemas Asociados

  • En funciones no convexas, es posible encontrar puntos mínimos locales que no son los mínimos globales, complicando la búsqueda del óptimo.
  • La derivada indica la pendiente; igualar a cero ayuda a encontrar puntos donde la pendiente es nula. Esto se vuelve complicado con múltiples ecuaciones en funciones no convexas.

Estrategias para Resolver Múltiples Mínimos

  • Al resolver modelos complejos, se busca una solución para las funciones no convexas aprovechando la información proporcionada por la derivada.

Intuición Detrás del Descenso del Gradiente

Analogía Tridimensional

  • Se presenta una analogía donde se imagina un terreno tridimensional lleno de colinas y valles. El objetivo es descender al punto más bajo sin conocer el mapa.
  • La estrategia consiste en evaluar la inclinación (pendiente), moverse hacia abajo y repetir este proceso hasta llegar al mínimo.

Aplicación Matemática

  • Se traduce esta intuición a matemáticas: calcular derivadas parciales para cada parámetro permite determinar cómo descender en cada dirección.

Optimización de Funciones y el Gradiente

Concepto del Gradiente

  • El gradiente se define como un vector que indica la dirección en la que la pendiente asciende, utilizando direcciones en un mapa para los ejes norte-sur y este-oeste.
  • Para minimizar el coste, se utiliza el gradiente en sentido opuesto, actualizando los parámetros hasta llegar a una zona donde las variaciones del coste son mínimas.

Proceso de Minimización

  • Se introduce el ratio de aprendizaje, que determina cuánto afecta el gradiente a la actualización de los parámetros en cada iteración.
  • La visualización de funciones mediante curvas de nivel ayuda a entender los desniveles y mínimos locales en la función de coste.

Comportamiento del Algoritmo

  • Al ejecutar el algoritmo, se observa cómo avanza hacia zonas de mínimo coste; esto demuestra su efectividad con un ratio de aprendizaje adecuado.
  • Un valor muy pequeño del ratio puede hacer que el algoritmo sea ineficiente al requerir muchas iteraciones para aproximarse al mínimo.

Efectos del Ratio de Aprendizaje

  • Un valor elevado del ratio provoca pasos demasiado largos, impidiendo que el punto converja dentro de la zona mínima y generando bucles infinitos.
Video description

El Descenso del Gradiente es un algoritmo de optimización clave dentro del campo de la Inteligencia Artificial. En el vídeo de hoy veremos cuál es la intuición detrás de este algoritmo así como veremos para qué tipos de funciones es útil esta técnica. ¡No te lo pierdas! Puedes interactuar con el último ejemplo que hemos visto en este artículo! http://www.benfrederickson.com/numerical-optimization/ --- [Fe de errata] --- 05:40 - "Computo" falta la tilde: "Cómputo" ¡Si localizas algún error en el vídeo, coméntalo y lo incluiré en este apartado! --- ¡MÁS DOTCSV! ---- 💸 Patreon : https://www.patreon.com/dotcsv 👓 Facebook : https://www.facebook.com/AI.dotCSV/ 👾 Twitch!!! : https://www.twitch.tv/dotcsv 🐥 Twitter : https://twitter.com/dotCSV 📸 Instagram : https://www.instagram.com/dotcsv/ --- ¡MI TECNOLOGÍA! ---- ** Aquí no está toda mi tecnología, sólo aquella que realmente recomiendo. Usando estos links de Amazon yo me llevaré una comisión por tu compra :) ** [Tecnología básica para Youtube] 💻 Portátil - MSI GP72 7RDX Leopard : https://amzn.to/2CDwvgY 📸 Cámara - Canon EOS 750D : https://amzn.to/2CDPqbi 👁‍🗨 Objetivo 1 - EF 50 mm, F/1.8 : https://amzn.to/2CH7npx 👁‍🗨 Objetivo 2 - EF-S 18-135mm : https://amzn.to/2DuhL5t 👁‍🗨 Objetivo 3 - EF 24 mm, F/2.8 : https://amzn.to/2AYAFQm 🎤 Microfono - Blue Yeti Micro : https://amzn.to/2RItA0I 💡 Foco Luz - Foco LED Neewer : https://amzn.to/2AYCM6K 🌈 Luz Color - Tira ALED Light : https://amzn.to/2B2iY2l [Mis otros cacharros] 📱 Smartphone - Google Pixel 2 XL : https://amzn.to/2RMuY2v -- ¡MÁS CIENCIA! --- 🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí: http://scenio.es/colaboradores #Scenio