Aprendizado Profundo - Redes Neurais Adversárias Generativas (GAN)
Introdução às Redes Neurais Adversariais Generativas (GAN)
Visão geral da seção: Nesta seção, vamos aprender sobre as redes neurais adversariais generativas, também conhecidas como GANs. Vamos entender a arquitetura dessa rede e como ela é organizada. Também veremos como é feito o processo de treinamento do modelo e algumas ilustrações que utilizam a rede GAN para geração de imagens.
Arquitetura da Rede GAN
- A rede GAN é composta por duas redes distintas: uma rede geradora e uma rede discriminadora.
- O objetivo do gerador é criar exemplos da melhor forma possível com o objetivo de enganar o discriminador até o ponto em que ele não consiga mais definir se aquele exemplo é um exemplo real ou falso.
- O discriminador tenta melhorar cada vez mais sua capacidade de discriminar entre um objeto real do conjunto de treinamento e um objeto gerado pelo gerador.
Treinamento Direto vs Indireto
- Existem duas formas principais de treinar modelos generativos: treinamento direto e indireto.
- No treinamento direto, o modelo tenta aproximar uma função ou distribuição de probabilidade conhecida. Já no treinamento indireto, o modelo aprende a partir dos dados como esses dados estão distribuídos.
- A rede GAN faz uso do processo indireto para otimizar as duas redes neurais existentes que operam de forma adversária.
Tipos de Redes Neurais Utilizadas na Rede GAN
- Diferentes tipos de redes neurais podem ser utilizadas tanto para compor o gerador como para compor o discriminador, dependendo do tipo de dados que estamos utilizando. Por exemplo, se estamos utilizando imagens, é provável que utilizemos camadas convolucionais. Se estamos utilizando um dado texto ou sequencial, é provável que utilizemos modelos baseados em redes recorrentes.
Conclusão
- A rede GAN é uma das ideias mais interessantes em aprendizado de máquina nos últimos 10 anos.
- O gerador e o discriminador competem entre si ao longo do processo de treinamento da rede GAN.
- O objetivo final da rede GAN é aproximar com bastante fidelidade a distribuição original dos dados confundindo totalmente o discriminador.
Introdução à Rede Generativa Adversarial (GAN)
Visão geral da seção: Nesta seção, o palestrante apresenta uma introdução à Rede Generativa Adversarial (GAN), explicando como ela funciona e suas aplicações.
Como a GAN funciona
- A GAN é composta por duas redes: o gerador e o discriminador.
- O gerador utiliza o gradiente para amplificar o erro do discriminador, tentando confundi-lo.
- O discriminador utiliza o retrogradiente para minimizar o erro de classificação, tentando separar os objetos reais dos objetos gerados pelo gerador.
- O objetivo principal da GAN é minimizar a possível perda máxima no processo competitivo entre as duas redes.
Treinamento da GAN
- Durante o treinamento, o gerador melhora cada vez mais na geração de dados semelhantes aos existentes no conjunto de treinamento.
- O discriminador tem um trabalho cada vez mais difícil para encontrar a fronteira de separação entre os objetos reais e falsos.
- No equilíbrio do jogo competitivo, espera-se que o gerador produza uma distribuição de treino quase perfeita, tornando impossível para o discriminador ter um desempenho melhor que uma suposição aleatória.
Função de custo utilizada no treinamento
- A função de custo utilizada no treinamento da GAN é composta por duas partes: uma associada aos exemplos reais e outra associada aos exemplos gerados pelo gerador.
- O objetivo é minimizar a função de custo, minimizando o erro do discriminador e maximizando o desempenho do gerador.
Aplicações da GAN
- A GAN pode ser utilizada para gerar imagens realistas, como rostos humanos ou moléculas de fármacos.
- Também pode ser usada para gerar quadros que seguem o estilo de um determinado artista.
Redes Adversárias Generativas
Visão geral da seção: Nesta seção, o palestrante apresenta as redes adversárias generativas e como elas podem ser usadas para gerar novas imagens, moléculas e textos.
Introdução às Redes Adversárias Generativas
- As redes adversárias generativas são compostas por um gerador e um discriminador.
- O gerador cria novos dados que imitam os dados de entrada.
- O discriminador avalia a autenticidade dos dados criados pelo gerador em comparação com os dados de entrada.
- O processo é antagônico, onde o objetivo do gerador é enganar o discriminador e o objetivo do discriminador é identificar os dados falsos.
Aplicações das Redes Adversárias Generativas
- As redes adversárias generativas têm diversas aplicações, incluindo geração de imagens, moléculas e textos.
- Elas também podem ser usadas para fazer tradução de imagem ou texto e super resolução de imagens.
- É possível treinar uma rede com texto de um autor específico para gerar novos textos no estilo daquele autor.
Limitações das Redes Adversárias Generativas
- A principal limitação das redes adversárias generativas é o treinamento.
- Nem sempre a rede converge adequadamente durante o processo antagônico.
- Pode haver um trade-off entre acurácia e cobertura.
- Limitações no discriminador podem prejudicar a capacidade do gerador em criar imagens autênticas.
Próxima Aula
- Na próxima aula, o palestrante irá implementar modelos generativos para gerar dados semelhantes aos do conjunto de dados fornecido.
Agradeço a atenção de todos e até a próxima aula.