Introduction to Generative AI
Introdução à IA Generativa
O que é IA Generativa?
- A IA generativa é uma tecnologia de inteligência artificial capaz de produzir diversos tipos de conteúdo, incluindo texto, imagens, áudio e dados sintéticos.
Contexto sobre Inteligência Artificial
- A inteligência artificial (IA) é um ramo da ciência da computação que se concentra na criação de agentes inteligentes que podem raciocinar, aprender e agir autonomamente.
- A IA envolve teorias e métodos para construir máquinas que imitam o pensamento e a ação humana.
Aprendizado de Máquina
- O aprendizado de máquina (ML) é um subcampo da IA que treina modelos a partir de dados de entrada, permitindo previsões úteis com novos dados.
- Existem dois tipos principais de modelos: supervisionados (com dados rotulados) e não supervisionados (sem rótulos).
Exemplos Práticos
- Um modelo supervisionado pode prever gorjetas em um restaurante com base em dados históricos sobre contas e tipo de pedido (retirada ou entrega).
- Modelos não supervisionados buscam descobrir padrões nos dados brutos, como agrupar funcionários por tempo de serviço e renda.
Compreensão dos Modelos
- Em aprendizado supervisionado, o modelo tenta minimizar erros entre valores previstos e reais durante o treinamento.
Aprendizado Profundo
O Que É Aprendizado Profundo?
- O aprendizado profundo é uma técnica dentro do aprendizado de máquina que utiliza redes neurais artificiais para processar padrões complexos.
Estrutura das Redes Neurais
- As redes neurais são compostas por muitos nós interconectados (neurônios), permitindo a aprendizagem através do processamento dos dados.
Tipos de Aprendizado em Redes Neurais
- O aprendizado semi-supervisionado combina pequenas quantidades de dados rotulados com grandes quantidades não rotuladas para melhorar a generalização do modelo.
IA Generativa no Contexto do Aprendizado Profundo
Classificação dos Modelos
Modelos Discriminativos vs. Modelos Generativos
Diferenças Fundamentais entre os Modelos
- O modelo discriminativo aprende a distribuição de probabilidade condicional, ou seja, a probabilidade de Y (saída) dado X (entrada), como classificar uma imagem como um cachorro e não um gato.
- O modelo generativo aprende a distribuição de probabilidade conjunta, permitindo prever a probabilidade condicional e gerar novas instâncias de dados, como imagens ou textos.
Exemplos Visuais dos Modelos
- A comparação visual entre modelos tradicionais de aprendizado de máquina e modelos generativos ilustra que o primeiro tenta aprender relações entre dados e rótulos, enquanto o segundo busca padrões para gerar novos conteúdos.
- Um exemplo prático é que se o resultado for um número ou classe (como "spam" ou "não spam"), não é gerado; se for linguagem natural (texto, áudio ou imagem), é considerado gerado.
Matemática por Trás dos Modelos
- A equação y = f(x) calcula a saída dependente do processo com base em diferentes entradas. Aqui, Y representa a saída do modelo e X as entradas utilizadas na fórmula.
- Se Y for um número (ex: vendas previstas), não é IA generativa; se Y for uma frase (ex: "Defina vendas"), é IA generativa porque gera uma resposta textual baseada em dados massivos.
Processo de Aprendizado Supervisionado vs. IA Generativa
- O aprendizado supervisionado tradicional utiliza código de treinamento e dados rotulados para construir um modelo que pode prever ou classificar informações.
- Em contraste, o processo da IA generativa pode usar dados rotulados e não rotulados para criar modelos fundamentais capazes de gerar texto, imagens, áudio e vídeo.
Evolução da Programação até os Modelos Generativos
- A transição da programação tradicional para redes neurais permitiu que usuários gerassem seu próprio conteúdo sem precisar codificar regras específicas.
- Exemplos como Gemini (modelo multimodal da Google) mostram como grandes quantidades de dados são usadas para construir modelos linguísticos fundamentais acessíveis através de perguntas simples.
Definição Oficial da IA Generativa
Compreendendo a IA Generativa
- A IA generativa cria novo conteúdo baseado no aprendizado prévio. O processo envolve treinamento em conteúdo existente resultando na criação de um modelo estatístico.
- Quando recebe um prompt, utiliza esse modelo estatístico para prever respostas esperadas, aprendendo estruturas subjacentes dos dados treinados.
Tipos Diferentes de Modelos Geradores
- Os modelos geradores podem variar: enquanto os modelos linguísticos geram combinações textuais naturais, os modelos visuais podem transformar imagens em texto ou vice-versa.
Exemplificação Prática com Modelos Linguísticos
- Um exemplo prático mostra como esses modelos preveem completamentos textuais com base nos padrões aprendidos durante o treinamento.
Respostas Contextualizadas em Questões Complexas
O Poder da IA Generativa e Modelos Transformers
Introdução aos Modelos Transformers
- A revolução em processamento de linguagem natural começou com os modelos Transformers, que consistem em um codificador e um decodificador. O codificador processa a sequência de entrada, enquanto o decodificador aprende a decodificar essa informação.
Problemas com Alucinações
- Um dos desafios enfrentados pelos Transformers são as "alucinações", que são palavras ou frases geradas que podem ser sem sentido ou gramaticalmente incorretas.
- As alucinações podem ocorrer devido à falta de dados suficientes para treinamento, dados ruidosos ou sujos, ou quando o modelo não recebe contexto adequado. Isso pode dificultar a compreensão do texto gerado.
Design de Prompts
- Um prompt é um pequeno trecho de texto fornecido a um modelo de linguagem grande (LLM), usado para controlar a saída do modelo. O design do prompt é crucial para gerar resultados desejados.
- A eficácia da IA generativa depende fortemente dos dados utilizados no treinamento, pois o modelo analisa padrões e estruturas desses dados.
Tipos de Modelos Disponíveis
- Existem diferentes tipos de modelos baseados em texto:
- Modelos Texto-a-Texte: Traduzem uma língua para outra.
- Modelos Texto-a-Imagens: Geram imagens baseadas em descrições textuais usando métodos como difusão.
- Modelos Texto-a-Vídeo: Criam representações em vídeo a partir de entradas textuais.
- Modelos Texto-a-Tarefa: Realizam ações definidas com base na entrada textual.
Modelos Fundamentais e Suas Aplicações
- Os modelos fundamentais são grandes modelos pré-treinados adaptáveis a diversas tarefas downstream, como análise de sentimentos e reconhecimento de objetos. Eles têm potencial revolucionário em várias indústrias.
- Exemplos incluem análise de sentimentos sobre produtos ou serviços e detecção de fraudes.
Geração de Código com IA Generativa
- A geração automática de código pode ajudar na depuração, tradução entre linguagens e criação de documentação. Um exemplo prático envolve converter arquivos Python para JSON utilizando ferramentas como Gemini.
Ferramentas do Google Cloud para IA Generativa
Construindo IA Generativa com Vertex AI
Introdução ao Vertex AI Agent Builder
- O Vertex AI Agent Builder permite que pessoas sem muita experiência em programação construam buscas generativas e conversas para clientes e funcionários.
- É possível criar chatbots, assistentes digitais, motores de busca personalizados e bases de conhecimento com pouco ou nenhum código.
- Não é necessário ter experiência prévia em aprendizado de máquina para utilizar essa ferramenta.
Modelo Multimodal Gemini
- O Gemini é um modelo de IA multimodal que vai além dos modelos tradicionais, pois não se limita apenas à compreensão de texto.
- Ele pode analisar imagens, entender nuances de áudio e até interpretar códigos de programação.
- Essa versatilidade permite que o Gemini execute tarefas complexas que antes eram impossíveis para a IA convencional.
Adaptabilidade e Escalabilidade do Gemini
- Devido à sua arquitetura avançada, o Gemini é altamente adaptável e escalável, tornando-o adequado para diversas aplicações.
- O Model Garden está em constante atualização para incluir novos modelos, ampliando as possibilidades de uso da IA generativa.
Conclusão do Curso
- Embora não se tenha aprendido tudo sobre IA generativa, os conceitos básicos foram abordados no curso.