Redes Neuronales Recurrentes: EXPLICACIÓN DETALLADA

Name: Redes Neuronales Recurrentes: EXPLICACIÓN DETALLADA
Uploaded: 2019-06-22T05:15:00.000Z
Duration: 14 min 58 s

Introducción al curso de redes neuronales recurrentes

Resumen de la sección: En esta sección introductoria, Miguel Sotaquirá presenta el curso sobre redes neuronales recurrentes y destaca su importancia en el campo del Deep Learning. Explica cómo las redes recurrentes permiten analizar secuencias de datos que cambian con el tiempo, como vídeos, conversaciones y textos. Además, menciona que estas redes utilizan un elemento clave llamado activación o estado oculto para preservar y compartir información entre diferentes estados de la red.

Estructura interna de una red neuronal recurrente

Una red neuronal convencional no puede generar nombres de dinosaurios debido a su falta de capacidad para analizar secuencias.

Las redes neuronales convolucionales sufren de "amnesia" ya que solo consideran la entrada actual y no tienen en cuenta entradas pasadas o futuras.

Las redes recurrentes resuelven este problema al tener en cuenta información previa para generar salidas precisas en secuencias.

Cada instante de tiempo en una secuencia se representa mediante un número entero que define la posición del elemento dentro de la secuencia.

La entrada en el instante "t" se denota como "x_t" y la salida como "y_t".

La red recurrente utiliza activaciones o estados ocultos para preservar y compartir información entre instantes de tiempo.

Cálculo de las salidas y activaciones

Las flechas horizontales rojas representan las entradas y salidas de la red recurrente en cada instante de tiempo.

La activación actual se calcula a partir de la transformación de la entrada actual y la activación anterior, seguida de una función de activación no lineal.

Los coeficientes "w_aa", "w_ax" y "b_a" se obtienen durante el entrenamiento para calcular las activaciones.

La salida se calcula utilizando la activación previa y aplicando las mismas operaciones que en el cálculo de la activación.

Los coeficientes "w_ya" y "b_y" también se obtienen durante el entrenamiento para calcular las salidas.

Memoria y recurrencia en redes recurrentes

La salida en un instante depende tanto de la activación actual como del valor previo de la activación, lo que demuestra cómo las redes recurrentes tienen memoria.

Las redes recurrentes son capaces de preservar y compartir información entre diferentes instantes de tiempo gracias a sus estados ocultos o activaciones.

¡Listo! Hemos cubierto los conceptos básicos sobre las redes neuronales recurrentes.

Redes Neuronales Recurrentes

Resumen de la sección: En esta sección se explica cómo las redes neuronales recurrentes permiten analizar secuencias. Se destaca que una red recurrente utiliza los mismos coeficientes para calcular los resultados en cada instante de tiempo, lo que permite generar predicciones utilizando el mismo set de parámetros. Además, se menciona que en lugar de representar gráficamente la red en diferentes instantes de tiempo, se puede utilizar una representación compacta donde una flecha indica la dependencia entre la activación actual y la generada en un instante anterior.

Coeficientes compartidos entre instantes de tiempo

Las redes neuronales recurrentes utilizan los mismos coeficientes para calcular los resultados en cada instante de tiempo.

Esto permite generar predicciones utilizando el mismo set de parámetros.

La idea es que una vez entrenada, la red recurrente sea capaz de generar la predicción usando el mismo set de parámetros en cada instante de tiempo.

Representación compacta

En lugar de dibujar lo que sucede con la red en diferentes instantes de tiempo, se puede utilizar una representación compacta.

Una flecha indica la dependencia entre la activación actual y la generada en un instante anterior.

Esta representación compacta facilita visualizar cómo se preserva información de instantes anteriores.

Memoria en Redes Neuronales Recurrentes

Resumen de la sección: En esta sección se explica cómo las redes neuronales recurrentes permiten preservar información a través del tiempo, lo cual equivale a su capacidad de memoria.

Entradas en una red recurrente

Una red recurrente utiliza dos entradas: el dato actual y la activación o estado oculto anterior.

Al combinar estos elementos, la red recurrente puede generar una nueva predicción y preservar información de instantes anteriores.

Esto es lo que permite a la red recurrente tener memoria.

Implementación Práctica de una Red Recurrente

Resumen de la sección: En esta sección se menciona que en el próximo video se verá cómo combinar todos los elementos explicados hasta ahora en un ejemplo práctico. Se utilizará la librería Keras para implementar paso a paso una red recurrente.

Próximo video

En el próximo video se mostrará cómo combinar todos los elementos explicados hasta ahora.

Se implementará paso a paso una red recurrente utilizando la librería Keras.