ComfyUI - Guía paso a paso de instalación y uso para generar imágenes con IA
¿Cómo generar imágenes con Inteligencia Artificial usando Config UI?
Introducción a Config UI
- Se presenta Config UI como una interfaz de usuario basada en nodos para utilizar Stable Diffusion y otros modelos de generación de imágenes con IA.
- Permite construir flujos de trabajo personalizados para obtener resultados específicos, reutilizando imágenes generadas previamente.
Ventajas y Funcionalidades
- Los workflows pueden variar desde simples hasta complejos; se explicarán las bases y se proporcionarán ejemplos descargables.
- No es necesario programar un workflow propio, lo que facilita el uso para principiantes.
Instalación de Config UI
- Se recomienda instalar Config UI utilizando Rampod, siguiendo instrucciones disponibles en GitHub.
- Para usar Rampod, hay que registrarse y recargar la cartera con un mínimo de $10.
Despliegue en la Nube
- Una vez registrado en Rampod, se debe buscar un RTX 3090 para desplegar el ordenador en la nube.
- Al hacer clic en "Connect", se accede a Jupyter Lab donde se procederá a instalar los diferentes componentes necesarios.
Proceso de Instalación
- Se instalan dependencias seleccionando cada apartado y presionando el botón "Play".
- El modelo utilizado será Stable Diffusion XL; algunos pasos pueden omitirse si no son necesarios por ahora.
Funcionamiento Básico de Config UI
- La interfaz básica permite cargar checkpoints (modelos), facilitando su uso sin necesidad de descargas adicionales.
- Se explica cómo separar nodos dentro del flujo para mejorar la visualización y organización del trabajo.
Creación de Imágenes
- Se utilizan campos de texto para definir prompts positivos y negativos que guiarán la generación de imágenes.
Generación de Imágenes con Config UI
Ajustes Iniciales para la Generación de Imágenes
- Se selecciona un tamaño de imagen de 1024x1024 en lugar de 512, y se establece el batch size a 2 para generar dos imágenes simultáneamente.
- El nodo del sampler se configura para que el SID sea aleatorio, permitiendo que cada generación de imagen tenga un SID diferente.
Parámetros Específicos para la Creación
- Se ajustan los parámetros: pasos a 30, CFG a 6, y se elige el sampler "2s ancestral".
- La imagen generada se guarda con el prefijo "configu", y al presionar el botón "prompt" comienza la generación.
Proceso de Generación y Visualización
- Durante la generación, se muestra una barra verde que indica el progreso; este proceso incluye varios nodos como prompts positivos y negativos.
- Se pueden ampliar las imágenes generadas utilizando la rueda del ratón o estirando el nodo visualizador.
Almacenamiento y Nombres de Archivos
- Las imágenes generadas se guardan en la carpeta "output" donde está instalado Config UI, nombrándose secuencialmente (ej. configui_001).
- Un ejemplo práctico es generar una imagen fotorealista de un "perro pirata", mostrando cómo personalizar los prompts.
Carga de Workflows Avanzados
- Se puede volver al estado por defecto usando "load default", lo cual restablece todos los parámetros a su configuración inicial.
- Para cargar workflows avanzados, simplemente arrastrar una imagen permite utilizar configuraciones más complejas como modelos base y refinadores.
Configuración Detallada del Workflow
- En un workflow avanzado, se seleccionan tanto un modelo base como uno refinador; no es necesario conocer todos los detalles técnicos.
- Se definen pasos totales (30), así como cuándo cambiar del modelo base al refinador (en este caso en el paso 25).
Ejecución Final del Proceso
- Al iniciar la generación con estos ajustes avanzados, primero pasa por el modelo base durante 25 pasos antes de pasar al refinador.
¿Cómo utilizar modelos en Stable Diffusion XL?
Introducción a los Workflows
- Se presentan dos imágenes generadas con Stable Diffusion XL y su refiner, destacando la calidad impresionante y el nivel de detalle espectacular.
- Se mencionan dos workflows básicos: uno normal y otro que incluye el refiner.
Descarga de Modelos Personalizados
- Para descargar modelos personalizados, se utiliza un modelo para generar imágenes estilo dibujos animados 3D (checkpoint) y un Lora para crear imágenes de nubes.
- Se explica cómo acceder a Jupiter Lab para gestionar los modelos descargados, indicando que deben ser colocados en la carpeta correspondiente.
Proceso de Descarga
- Si la carpeta de Checkpoints no funciona, se puede usar una terminal para descargar el modelo directamente en la carpeta de models usando
wget.
- Una vez descargado, es necesario renombrar el archivo añadiendo
.safe tensorspara que sea reconocido como modelo.
Instalación del Lora
- El proceso para instalar un Lora es similar al del checkpoint; se descarga utilizando
wgety se renombra adecuadamente.
- Después de instalar ambos modelos, se recarga la interfaz de Config UI para poder utilizarlos.
Generación de Imágenes
- Al seleccionar el modelo "Samaritan 3D cartoon", se cambia la resolución a 1024x1024 y se genera una imagen rápidamente.
- Se menciona que si se quiere usar un Lora, hay que modificar ligeramente el workflow existente.
Modificación del Workflow
- Para utilizar un Lora, se arrastra un nuevo nodo al workflow donde se selecciona tanto el checkpoint como el cargador del Lora.
- Se pueden modificar los prompts y ajustar parámetros como tamaño e cantidad de pasos (steps).
Resultados Finales
- Al ejecutar el proceso con un prompt específico sobre nubes, se genera una imagen satisfactoria que representa lo solicitado.
- Se destaca la efectividad del Lora utilizado y su facilidad de implementación dentro del workflow.
Personalización Adicional
- Se menciona la posibilidad de añadir personalizaciones adicionales a Config UI mediante extensiones disponibles en repositorios específicos.
Cómo reiniciar y utilizar Config UI para crear imágenes con IA
Proceso de reinicio del servidor
- Se selecciona la casilla correspondiente y se presiona "stop" para detener el servidor. Al hacerlo, se indica que el servidor ha dejado de funcionar.
- Después de detenerlo, se vuelve a seleccionar la misma casilla y se presiona "Play" para reiniciar el servidor, lo que permite restablecer la conexión en unos segundos.
- Una vez conectado nuevamente, es necesario recargar la interfaz para asegurarse de que todo funcione correctamente con cualquier flujo de trabajo predeterminado.
Funcionalidades adicionales
- Además del proceso básico, hay muchas más funcionalidades disponibles como instalar nodos personalizados o modelos específicos que puedan ser necesarios.
- También se pueden actualizar herramientas y realizar diversas configuraciones avanzadas dentro de Config UI para mejorar la experiencia al crear imágenes con inteligencia artificial.
Interacción y contenido adicional
- Se invita a los usuarios a dejar comentarios si tienen dudas o propuestas sobre nuevo contenido relacionado con inteligencia artificial.