Super Easy Stable Diffusion - Run Locally and Privately with Ease

Name: Super Easy Stable Diffusion - Run Locally and Privately with Ease
Uploaded: 2024-01-08T00:00:00.000Z
Duration: 40 min 39 s

Introdução ao Uso Básico do Fooocus para Stable Diffusion

Configuração Inicial

O vídeo aborda o uso básico do Fooocus para Stable Diffusion, com planos de discutir tópicos mais avançados em vídeos futuros.

Após baixar e instalar o Fooocus, existem três arquivos .bat na pasta extraída: run.bat (para a aplicação padrão), anime.bat (otimizado para anime) e realistic.bat (otimizado para imagens realistas).

Ao iniciar pela primeira vez, o programa baixa modelos necessários e atualizações antes de abrir a aplicação no navegador.

Estrutura de Pastas

Na pasta do Fooocus, há uma subpasta chamada "Fooocus" que contém as pastas "models" e "outputs".

A pasta "outputs" armazena as imagens geradas, organizadas por data. A pasta "models" é onde se colocam novos modelos ou checkpoints baixados.

Como Usar o Fooocus

Criação de Prompts

O foco do Fooocus está nos prompts, permitindo que os usuários não precisem ajustar muitas configurações como em outras ferramentas.

É importante colocar os elementos mais relevantes no início do prompt; por exemplo: “uma mulher sentada à beira do rio com um vestido vermelho”.

Ajustes Finais nos Prompts

Se a imagem gerada não for satisfatória, é possível pular para a próxima geração ou parar o processo.

Para dar mais peso a certos elementos no prompt, pode-se usar parênteses e um valor numérico após dois pontos. Por exemplo: "(água branca:1.5)" aumenta a ênfase na água branca.

Experimentação com Pesos nos Prompts

Testes Práticos

Alterar pesos em prompts pode resultar em diferenças visuais significativas nas imagens geradas; por exemplo, aumentar o peso da descrição de um nariz grande resulta em uma imagem com um nariz proporcionalmente maior.

Configurações e Geração de Imagens

Seção de Desempenho

A seção de desempenho permite ajustar a velocidade, qualidade ou extrema velocidade na geração de imagens. A configuração padrão é 30 passos para velocidade, 60 passos para qualidade e 8 passos para extrema velocidade.

O número de passos influencia diretamente a qualidade da imagem gerada; mais passos geralmente resultam em melhores imagens, mas isso depende do que está sendo criado.

Proporções e Geração de Imagens

As proporções definem o tamanho da imagem e são apresentadas como predefinições seguras para evitar resultados estranhos ao inserir valores manualmente.

É possível definir quantas imagens gerar ao clicar no botão "gerar". Para testes iniciais, recomenda-se gerar uma ou duas imagens antes de aumentar a quantidade.

Prompt Negativo

O prompt negativo é utilizado para indicar elementos indesejados na imagem. Embora não garanta a exclusão total desses elementos, ajuda a direcionar a IA.

É aconselhável limitar o uso do prompt negativo a algumas linhas curtas para evitar resultados confusos.

Sementes Aleatórias

A opção "aleatório" refere-se à semente utilizada na criação da imagem. Por padrão, utiliza-se uma semente aleatória, mas pode ser útil especificar uma semente quando se busca um resultado semelhante ao anterior.

Cada imagem gerada tem um número sequencial de sementes; copiar uma semente específica permite regenerar uma imagem com características semelhantes.

Estilos e Aplicações

Os estilos funcionam como envoltórios para os prompts inseridos. Ao escolher um estilo específico, ele adiciona automaticamente outros elementos ao seu prompt original.

Geração de Imagens com Fooocus

Uso da Semente e Estilos

O apresentador menciona que a mesma semente será utilizada para gerar uma nova imagem, permitindo observar como isso afeta o resultado em relação ao prompt original.

A diferença nos resultados é notável após a aplicação de estilos, destacando a importância dos parâmetros na geração de imagens.

Carregamento de Modelos e Checkpoints

O modelo padrão utilizado pelo Fooocus é o Juggernaut XL, que não utiliza um refinador. Para modelos SDXL padrão, é necessário escolher entre base e refinador.

Muitos checkpoints não requerem um refinador; portanto, não há necessidade de executá-lo nesse caso.

LoRAs e Exemplos Práticos

Os arquivos LoRA são descritos como específicos e não completos; eles precisam ser acionados por palavras-chave específicas para funcionar corretamente.

O apresentador demonstra como carregar um LoRA treinado especificamente para seu animal de estimação, mostrando a diferença significativa na geração da imagem quando o token correto é usado.

Escala de Orientação e Resultados Visuais

A escala de orientação no Fooocus difere das escalas em outras plataformas; valores mais altos resultam em imagens mais limpas e artísticas.

Comparações entre imagens geradas com diferentes escalas mostram diferenças marcantes na qualidade visual.

Ajustes Finais e Recursos Adicionais

O apresentador discute ajustes na nitidez das imagens, demonstrando os efeitos visuais conforme as configurações variam.