Important Prompting Tips - Stable Diffusion, Fooocus, Midjourney and others
Dicas para Gerar Imagens com Stable Diffusion
Introdução ao Prompting
- Rodney apresenta o tema do vídeo, que é sobre como gerar imagens usando prompts em Stable Diffusion e outras IAs generativas.
- O apresentador menciona que usará o Fooocus, uma interface fácil de usar para Stable Diffusion, e que abordará diversos tópicos relacionados a prompts.
Estrutura dos Prompts
- A interação principal com a IA ocorre através de prompts textuais, que são comparados a pedir a um amigo para desenhar algo.
- É destacado que muitos usuários não obtêm os resultados esperados porque escrevem como se estivessem conversando com outra pessoa, enquanto a IA entende apenas palavras-chave.
Construindo Prompts Eficazes
- Para criar um prompt eficaz, recomenda-se começar simples e aumentar os detalhes gradualmente. Prompts muito longos podem confundir a IA.
- A chave é encontrar um equilíbrio entre ser descritivo o suficiente para guiar o processo de geração da imagem e deixar espaço para interpretações criativas da IA.
Elementos Importantes nos Prompts
- Os elementos essenciais incluem: sujeito (pessoa, lugar ou objeto), adjetivos/descrições do sujeito e ambiente/setting onde a ação ocorre.
- Outros aspectos importantes são: ação ou atividade do sujeito, humor/atmosfera da cena e estilo/mídia desejada (ex.: aquarela ou fotografia realista).
Experimentação e Aprendizado
- A perspectiva e composição também influenciam os resultados; diferentes ângulos de câmera podem alterar significativamente as imagens geradas.
- Recomenda-se experimentar com diferentes termos e estruturas de frases nos prompts. Manter as instruções curtas pode facilitar melhores resultados.
Conclusão sobre Práticas de Prompting
Como o Fooocus Funciona?
Introdução ao Fooocus e seu Motor de Processamento
- O Fooocus possui um motor de processamento de prompts offline, alimentado pelo GPT-2, que melhora a qualidade visual dos resultados, independentemente do comprimento do prompt. No entanto, recomenda-se não ultrapassar 500 palavras para evitar erros.
Estilos e Palavras-Chave Dinâmicas
- Ao ativar o Fooocus V2 na seção de Estilos, mais palavras-chave são adicionadas ao prompt de forma dinâmica, melhorando os resultados mesmo com prompts curtos como "um gato".
- Os estilos no Fooocus funcionam como envoltórios para adicionar mais palavras-chave. Diferente de outras ferramentas como MidJourney, o Fooocus não utiliza parâmetros como estilo ou proporção; essas configurações estão dentro do menu.
Prompts Negativos e Peso dos Prompts
- Prompts negativos são utilizados para especificar elementos indesejados em uma imagem. Contudo, é geralmente mais eficaz construir um bom prompt regular do que depender excessivamente dos negativos.
- O peso do prompt determina a prioridade das seções ou palavras. Colocar informações no início aumenta seu peso em comparação com as que estão no final.
Ajustes Finais e Resultados
- Para aumentar o peso de uma palavra ou frase específica, pode-se usar parênteses; múltiplos parênteses aumentam ainda mais esse peso. Atalhos também podem ser usados para ajustar rapidamente os pesos.
- A comparação entre diferentes pesos (como padrão vs 1.5) mostra que ajustes impactam significativamente os resultados gerados pela IA.
Uso de Prompts Multilinha
- O Fooocus permite o uso de prompts multilinha onde cada linha alterna durante a geração da imagem. Isso requer ajustes nos pesos para garantir uma boa mistura entre diferentes elementos.
Efeito de Associação na Geração de Imagens
Compreendendo o Efeito de Associação
- O efeito de associação refere-se à tendência de gerar imagens baseadas em associações culturais. Por exemplo, ao solicitar uma enfermeira conversando com um paciente, as imagens geradas tendem a ser predominantemente femininas.
- Quando se pede "Taylor Swift em um vestido", as poses e estilos das roupas são influenciados pela imagem pública da cantora, enquanto "uma mulher em um vestido" resulta em uma variedade maior de estilos.
- A geração de imagens também pode refletir preconceitos relacionados à cor dos olhos. Ao pedir por uma jovem com olhos azuis, é comum que apareçam características associadas a essa cor, como cabelo loiro.
Dicas para Geração de Imagens
- Um erro comum entre iniciantes em IA generativa é incluir elementos indesejados no prompt. Por exemplo, ao descrever um carro velho "sem pneus", isso pode resultar na inclusão inesperada de pneus nas imagens geradas.