Super Easy Stable Diffusion - Run Locally and Privately with Ease
Introdução ao Uso Básico do Fooocus para Stable Diffusion
Configuração Inicial
- O vídeo aborda o uso básico do Fooocus para Stable Diffusion, com planos de discutir tópicos mais avançados em vídeos futuros.
- Após baixar e instalar o Fooocus, existem três arquivos .bat na pasta extraída:
run.bat(para a aplicação padrão),anime.bat(otimizado para anime) erealistic.bat(otimizado para imagens realistas).
- Ao iniciar pela primeira vez, o programa baixa modelos necessários e atualizações antes de abrir a aplicação no navegador.
Estrutura de Pastas
- Na pasta do Fooocus, há uma subpasta chamada "Fooocus" que contém as pastas "models" e "outputs".
- A pasta "outputs" armazena as imagens geradas, organizadas por data. A pasta "models" é onde se colocam novos modelos ou checkpoints baixados.
Como Usar o Fooocus
Criação de Prompts
- O foco do Fooocus está nos prompts, permitindo que os usuários não precisem ajustar muitas configurações como em outras ferramentas.
- É importante colocar os elementos mais relevantes no início do prompt; por exemplo: “uma mulher sentada à beira do rio com um vestido vermelho”.
Ajustes Finais nos Prompts
- Se a imagem gerada não for satisfatória, é possível pular para a próxima geração ou parar o processo.
- Para dar mais peso a certos elementos no prompt, pode-se usar parênteses e um valor numérico após dois pontos. Por exemplo: "(água branca:1.5)" aumenta a ênfase na água branca.
Experimentação com Pesos nos Prompts
Testes Práticos
- Alterar pesos em prompts pode resultar em diferenças visuais significativas nas imagens geradas; por exemplo, aumentar o peso da descrição de um nariz grande resulta em uma imagem com um nariz proporcionalmente maior.
Configurações e Geração de Imagens
Seção de Desempenho
- A seção de desempenho permite ajustar a velocidade, qualidade ou extrema velocidade na geração de imagens. A configuração padrão é 30 passos para velocidade, 60 passos para qualidade e 8 passos para extrema velocidade.
- O número de passos influencia diretamente a qualidade da imagem gerada; mais passos geralmente resultam em melhores imagens, mas isso depende do que está sendo criado.
Proporções e Geração de Imagens
- As proporções definem o tamanho da imagem e são apresentadas como predefinições seguras para evitar resultados estranhos ao inserir valores manualmente.
- É possível definir quantas imagens gerar ao clicar no botão "gerar". Para testes iniciais, recomenda-se gerar uma ou duas imagens antes de aumentar a quantidade.
Prompt Negativo
- O prompt negativo é utilizado para indicar elementos indesejados na imagem. Embora não garanta a exclusão total desses elementos, ajuda a direcionar a IA.
- É aconselhável limitar o uso do prompt negativo a algumas linhas curtas para evitar resultados confusos.
Sementes Aleatórias
- A opção "aleatório" refere-se à semente utilizada na criação da imagem. Por padrão, utiliza-se uma semente aleatória, mas pode ser útil especificar uma semente quando se busca um resultado semelhante ao anterior.
- Cada imagem gerada tem um número sequencial de sementes; copiar uma semente específica permite regenerar uma imagem com características semelhantes.
Estilos e Aplicações
- Os estilos funcionam como envoltórios para os prompts inseridos. Ao escolher um estilo específico, ele adiciona automaticamente outros elementos ao seu prompt original.
Geração de Imagens com Fooocus
Uso da Semente e Estilos
- O apresentador menciona que a mesma semente será utilizada para gerar uma nova imagem, permitindo observar como isso afeta o resultado em relação ao prompt original.
- A diferença nos resultados é notável após a aplicação de estilos, destacando a importância dos parâmetros na geração de imagens.
Carregamento de Modelos e Checkpoints
- O modelo padrão utilizado pelo Fooocus é o Juggernaut XL, que não utiliza um refinador. Para modelos SDXL padrão, é necessário escolher entre base e refinador.
- Muitos checkpoints não requerem um refinador; portanto, não há necessidade de executá-lo nesse caso.
LoRAs e Exemplos Práticos
- Os arquivos LoRA são descritos como específicos e não completos; eles precisam ser acionados por palavras-chave específicas para funcionar corretamente.
- O apresentador demonstra como carregar um LoRA treinado especificamente para seu animal de estimação, mostrando a diferença significativa na geração da imagem quando o token correto é usado.
Escala de Orientação e Resultados Visuais
- A escala de orientação no Fooocus difere das escalas em outras plataformas; valores mais altos resultam em imagens mais limpas e artísticas.
- Comparações entre imagens geradas com diferentes escalas mostram diferenças marcantes na qualidade visual.
Ajustes Finais e Recursos Adicionais
- O apresentador discute ajustes na nitidez das imagens, demonstrando os efeitos visuais conforme as configurações variam.