HiDream i1 vs Flux Dev | ¿Cuál genera mejores imágenes con IA? + Comparativa y Upscaling en ComfyUI
¿Qué es Highdream i1 y cómo se compara con Flux Dep?
Introducción a la batalla de modelos
- Mauricio Perdomo da la bienvenida y presenta el tema: una comparación entre el nuevo modelo Highdream i1 y el conocido Flux Dep.
- Se anticipan análisis sobre calidad, eficiencia, velocidad y versiones disponibles del modelo.
Versiones del modelo Highdream i1
- Highdream i1 está disponible en tres versiones: Fast (ligera), Dep (intermedia) y Full (detallada).
- La versión Fast es ideal para generación rápida; la versión Dep ofrece un equilibrio entre calidad y velocidad; la versión Full es recomendada para máxima calidad en GPUs potentes.
Cuantizaciones y requisitos de hardware
- Las versiones FP16 pesan 34.2 GB, recomendando GPUs de 12 a 16 GB de RAM para su ejecución.
- Las versiones FP8 son más ligeras (17.1 GB), permitiendo su uso en GPUs de 8 a 12 GB, aunque los tiempos de generación variarán según el modelo utilizado.
Comparaciones visuales en Confi UI
- Se preparará un flujo en Confi UI para comparar las diferentes versiones del modelo Highdream junto con sus compresiones FP8.
- También se generará una imagen utilizando el modelo Flux Dep para evaluar cuál modelo ofrece mejores resultados.
Descarga e instalación de modelos
- Para descargar las versiones FP8 o FP16, se debe acceder al repositorio de Highdream i1 en Hugin Face.
- Es necesario descargar cuatro text encoders específicos que son requeridos por el modelo Highdream.
Opciones adicionales para pruebas
- Los usuarios pueden encontrar repositorios específicos para cada versión cuantizada del modelo Highdream en Hugin Face.
- Se recomienda probar formatos Q4KS o Q4KM si se tiene menos de 8 GB de RAM; los formatos Q8 son comparables a la versión FP16 pero más ligeros.
Preparativos finales antes de iniciar pruebas
- En este video solo se compararán las versiones Q8, Q4M y FP8.
- Los modelos deben ser guardados correctamente en carpetas específicas dentro del sistema antes de iniciar Confi UI.
Actualización necesaria antes del uso
- Es crucial actualizar tanto la aplicación como todos los nodos customizados instalados antes de comenzar las pruebas con Highdream.
Configuración y Comparación de Modelos de Generación de Imágenes
Creación de Flujos para Comparar Modelos
- Se requiere reiniciar Confi después de actualizar. Se han creado flujos para generar imágenes en diferentes versiones, utilizando una semilla fija para comparaciones uno a uno entre modelos.
Configuración Inicial del Modelo
- Se configura una imagen latente vacía que se ingresará al Campler. Se carga el BAUE utilizado previamente y un nodo clip cuádruple necesario para High Dream, seleccionando los cuatro text encoders descargados.
Parámetros Específicos por Modelo
- Para Highdam, las versiones full requieren un prom negativo, mientras que las versiones fast y dep también lo necesitan. Cada sección del flujo tiene parámetros específicos según la documentación oficial.
Recomendaciones de Configuración
- El modelo full necesita un model sampling chief de TR con 50 pasos, usando Unipaler Simple como sampler y CFG de 5.0 para considerar el prom negativo.
- Highdream Dep recomienda un model sampling chief de 6.0 o 28 pasos con LCM como sampler y CFG1 sin considerar el prom negativo.
Variaciones en la Generación de Imágenes
- Hydrinam fast es el más rápido, con modeling chief de 3.0 y solo 16 pasos; no considera el prom negativo (CFGD 1.0). Las configuraciones varían según cada modelo.
Comparativa entre Modelos
- Se repite el flujo para Hydream Fast Q8 usando Unit Loader GGUF, manteniendo otras configuraciones iguales. También se agrega comparación con modelos DEP Q8 y Q4.
Consideraciones sobre Recursos Gráficos
- Los modelos HighDAM full son recomendables solo si se dispone de una tarjeta gráfica con más de 16 GB RAM; caso contrario puede tardar hasta media hora en generar una imagen.
Evaluación Final y Resultados
- Al final se añade la generación mediante flux depo para comparar cuál modelo produce mejores imágenes; High Dream ha recibido buena puntuación frente a Flux 1.1 Pro.
Generación Práctica e Imágenes Resultantes
- Se genera una imagen donde una mujer saluda a asistentes utilizando Hydre fast FP8; se activa solo esta sección del flujo.
Comparativa Visual entre Modelos
- Se generan imágenes usando Hydream Fast FP8, Q8 y Q4; se pide ayuda en comentarios para determinar cuál compresión es mejor basándose en iluminación y definición.
Generación de Imágenes con Modelos Highdream y Flux
Introducción a los Modelos
- Se presentan los modelos High Dream Dep y High Dream Full, destacando la posibilidad de encontrar sorpresas en su uso. Se planea comparar las imágenes generadas por Highdream Dep con las de Flux Dep.
Configuración del Modelo Highdream Dep
- Se verifica que el modelo correcto esté seleccionado, utilizando un model sampling de seis y aumentando los pasos a 28 para la generación de imágenes en FP8, Q4 y Q8.
Resultados Iniciales de Highdream Dep
- Se completó la generación de tres imágenes para Hydring Dep. Un error notable fue en la representación de una mano, sugiriendo que cambiar la semilla podría mejorar el resultado.
- Comparando modelos, se observa que FP8 y Goof Q8 ofrecen mejor definición e iluminación. A pesar del error mencionado, el contraste y colores son superiores en el modelo dep.
Generación con Flux Dep
- Al generar imágenes con Flux, se asegura que se utilice el mismo prompt. Se omite un clip cuádruple ya que no es necesario para este modelo.
- La imagen generada por Flux muestra una velocidad notable; tomó menos tiempo que Hydram Fast. Sin embargo, la interpretación del prompt parece ser más efectiva en High Dream.
Comparativa entre Modelos
- Las tres imágenes generadas (Hydream Fast a la izquierda, Flux Dep al centro y Hydre Dep a la derecha) muestran diferencias significativas. Aunque Flux produce buenos resultados, se requiere mayor especificidad en el prompt para igualar a Highdream.
Análisis Adicional sobre Resultados
- En intentos previos con el mismo prompt, Hydr Fast mostró mejores resultados en FP8. Las variaciones Q4 y Q8 también tuvieron buenos desempeños.
- Una comparación adicional entre Flux Dep y Highdream Dep revela cómo cada uno interpreta un vestido transparente según lo indicado en el prompt.
Resultados Finales: Estilo Anime
- Al probar un estilo anime con diferentes modelos (Fast, Dep), se observan mejoras significativas en diseño y composición general con Hydre Dep.
- Para obtener una imagen más realista se recomienda usar el modelo full; sin embargo, para animaciones tipo anime, Highdream Dep ofrece resultados destacados.
Conclusiones sobre Modelos Utilizados
Comparación de Modelos de Animación
Análisis de Modelos Hydream Fast y Highdream Dep
- Se comparan los modelos Hydream Fast, FP8 y Q8, destacando que el modelo FP8 es preferido para este estilo de animación.
- El modelo Highdream Full se presenta como el más realista en comparación con los otros modelos, mostrando mejoras significativas en la iluminación.
- Se menciona que el modelo Full requiere 50 pasos para generar imágenes, casi el doble que el modelo Highdream Dep, que necesita solo 28 pasos.
Rendimiento y Recomendaciones
- Para usuarios con GPU RTX 3090 a 4090, el modelo Full puede generar imágenes en tres o cuatro minutos; sin embargo, para GPUs menos potentes se recomienda usar Highdream Dep.
- Comparativa entre Flux Dep y Highdream Dep muestra que ambos modelos generan buenas imágenes; Flux ofrece colores más cálidos.
Generación de Imágenes: Ejemplo de Paella
Resultados Comparativos
- En la generación de una paella, se observa confusión en las agarraderas por parte del modelo Hydream; solo el modelo Full logra representar correctamente cuatro agarraderas.
- La textura de la madera en la mesa es mejor representada por High Dream Full, destacando su capacidad para acercarse al realismo.
Evaluación General
- Aunque Flux hizo un buen trabajo replicando la realidad en algunos aspectos, falló ligeramente en la composición del fondo.
- Se concluye que Highdream tiene potencial para superar a Flux pero aún le faltan herramientas como Control Net in Painting.
Flujo de Generación Imagen a Imagen
Implementación del Flujo
- Se describe un flujo creado para generar imágenes a partir de otras imágenes cargadas automáticamente.
- Al cambiar la imagen latente por una referencia específica y ajustar parámetros como Dinois (que controla creatividad), se pueden obtener resultados variados.
Cambios Estilísticos
- Se intenta transformar una imagen generada al estilo Pixar mediante concatenación de instrucciones específicas.
- El resultado final muestra cambios sutiles pero efectivos en la posición y detalles manteniendo similitudes con la imagen original.
Experimentaciones Adicionales
¿Qué resultados se obtienen con el modelo High Dream Depth?
Comparación de modelos
- Se presenta el resultado del flujo imagen a imagen utilizando el modelo High Dream Depth, destacando su rendimiento en comparación con otros modelos.
- Se comparan tres versiones del modelo Highdream: Fast, FP8, Q4 y Q8, lo que permite evaluar sus diferencias y aplicaciones.
- También se realizan comparaciones con el modelo Flux Dep para entender mejor las capacidades de cada uno.
Generación de imágenes
- Se explica un flujo simple para generar imágenes a partir del modelo Highdream Dep, facilitando la comprensión de su funcionamiento.