ComfyUI - Guía paso a paso de instalación y uso para generar imágenes con IA

Name: ComfyUI - Guía paso a paso de instalación y uso para generar imágenes con IA
Uploaded: 2023-09-18T11:29:54.000Z
Duration: 36 min 13 s

¿Cómo generar imágenes con Inteligencia Artificial usando Config UI?

Introducción a Config UI

Se presenta Config UI como una interfaz de usuario basada en nodos para utilizar Stable Diffusion y otros modelos de generación de imágenes con IA.

Permite construir flujos de trabajo personalizados para obtener resultados específicos, reutilizando imágenes generadas previamente.

Ventajas y Funcionalidades

Los workflows pueden variar desde simples hasta complejos; se explicarán las bases y se proporcionarán ejemplos descargables.

No es necesario programar un workflow propio, lo que facilita el uso para principiantes.

Instalación de Config UI

Se recomienda instalar Config UI utilizando Rampod, siguiendo instrucciones disponibles en GitHub.

Para usar Rampod, hay que registrarse y recargar la cartera con un mínimo de $10.

Despliegue en la Nube

Una vez registrado en Rampod, se debe buscar un RTX 3090 para desplegar el ordenador en la nube.

Al hacer clic en "Connect", se accede a Jupyter Lab donde se procederá a instalar los diferentes componentes necesarios.

Proceso de Instalación

Se instalan dependencias seleccionando cada apartado y presionando el botón "Play".

El modelo utilizado será Stable Diffusion XL; algunos pasos pueden omitirse si no son necesarios por ahora.

Funcionamiento Básico de Config UI

La interfaz básica permite cargar checkpoints (modelos), facilitando su uso sin necesidad de descargas adicionales.

Se explica cómo separar nodos dentro del flujo para mejorar la visualización y organización del trabajo.

Creación de Imágenes

Se utilizan campos de texto para definir prompts positivos y negativos que guiarán la generación de imágenes.

Generación de Imágenes con Config UI

Ajustes Iniciales para la Generación de Imágenes

Se selecciona un tamaño de imagen de 1024x1024 en lugar de 512, y se establece el batch size a 2 para generar dos imágenes simultáneamente.

El nodo del sampler se configura para que el SID sea aleatorio, permitiendo que cada generación de imagen tenga un SID diferente.

Parámetros Específicos para la Creación

Se ajustan los parámetros: pasos a 30, CFG a 6, y se elige el sampler "2s ancestral".

La imagen generada se guarda con el prefijo "configu", y al presionar el botón "prompt" comienza la generación.

Proceso de Generación y Visualización

Durante la generación, se muestra una barra verde que indica el progreso; este proceso incluye varios nodos como prompts positivos y negativos.

Se pueden ampliar las imágenes generadas utilizando la rueda del ratón o estirando el nodo visualizador.

Almacenamiento y Nombres de Archivos

Las imágenes generadas se guardan en la carpeta "output" donde está instalado Config UI, nombrándose secuencialmente (ej. configui_001).

Un ejemplo práctico es generar una imagen fotorealista de un "perro pirata", mostrando cómo personalizar los prompts.

Carga de Workflows Avanzados

Se puede volver al estado por defecto usando "load default", lo cual restablece todos los parámetros a su configuración inicial.

Para cargar workflows avanzados, simplemente arrastrar una imagen permite utilizar configuraciones más complejas como modelos base y refinadores.

Configuración Detallada del Workflow

En un workflow avanzado, se seleccionan tanto un modelo base como uno refinador; no es necesario conocer todos los detalles técnicos.

Se definen pasos totales (30), así como cuándo cambiar del modelo base al refinador (en este caso en el paso 25).

Ejecución Final del Proceso

Al iniciar la generación con estos ajustes avanzados, primero pasa por el modelo base durante 25 pasos antes de pasar al refinador.

¿Cómo utilizar modelos en Stable Diffusion XL?

Introducción a los Workflows

Se presentan dos imágenes generadas con Stable Diffusion XL y su refiner, destacando la calidad impresionante y el nivel de detalle espectacular.

Se mencionan dos workflows básicos: uno normal y otro que incluye el refiner.

Descarga de Modelos Personalizados

Para descargar modelos personalizados, se utiliza un modelo para generar imágenes estilo dibujos animados 3D (checkpoint) y un Lora para crear imágenes de nubes.

Se explica cómo acceder a Jupiter Lab para gestionar los modelos descargados, indicando que deben ser colocados en la carpeta correspondiente.

Proceso de Descarga

Si la carpeta de Checkpoints no funciona, se puede usar una terminal para descargar el modelo directamente en la carpeta de models usando wget.

Una vez descargado, es necesario renombrar el archivo añadiendo .safe tensors para que sea reconocido como modelo.

Instalación del Lora

El proceso para instalar un Lora es similar al del checkpoint; se descarga utilizando wget y se renombra adecuadamente.

Después de instalar ambos modelos, se recarga la interfaz de Config UI para poder utilizarlos.

Generación de Imágenes

Al seleccionar el modelo "Samaritan 3D cartoon", se cambia la resolución a 1024x1024 y se genera una imagen rápidamente.

Se menciona que si se quiere usar un Lora, hay que modificar ligeramente el workflow existente.

Modificación del Workflow

Para utilizar un Lora, se arrastra un nuevo nodo al workflow donde se selecciona tanto el checkpoint como el cargador del Lora.

Se pueden modificar los prompts y ajustar parámetros como tamaño e cantidad de pasos (steps).

Resultados Finales

Al ejecutar el proceso con un prompt específico sobre nubes, se genera una imagen satisfactoria que representa lo solicitado.

Se destaca la efectividad del Lora utilizado y su facilidad de implementación dentro del workflow.

Personalización Adicional

Se menciona la posibilidad de añadir personalizaciones adicionales a Config UI mediante extensiones disponibles en repositorios específicos.

Cómo reiniciar y utilizar Config UI para crear imágenes con IA

Proceso de reinicio del servidor

Se selecciona la casilla correspondiente y se presiona "stop" para detener el servidor. Al hacerlo, se indica que el servidor ha dejado de funcionar.

Después de detenerlo, se vuelve a seleccionar la misma casilla y se presiona "Play" para reiniciar el servidor, lo que permite restablecer la conexión en unos segundos.

Una vez conectado nuevamente, es necesario recargar la interfaz para asegurarse de que todo funcione correctamente con cualquier flujo de trabajo predeterminado.

Funcionalidades adicionales

Además del proceso básico, hay muchas más funcionalidades disponibles como instalar nodos personalizados o modelos específicos que puedan ser necesarios.

También se pueden actualizar herramientas y realizar diversas configuraciones avanzadas dentro de Config UI para mejorar la experiencia al crear imágenes con inteligencia artificial.

Interacción y contenido adicional

Se invita a los usuarios a dejar comentarios si tienen dudas o propuestas sobre nuevo contenido relacionado con inteligencia artificial.