Los 5 mejores generadores de imágenes de IA de código abierto

enlaces rápidos

Lápiz de color

Difusión estable 1.5

DreamShaper

Invocar AI

viaje abierto

Los modelos de generación de texto a imagen basados en IA están en todas partes y cada día es más fácil acceder a ellos. Si bien es fácil visitar un sitio web y generar la imagen que estás buscando, los generadores de texto a imagen de código abierto son tu mejor opción si deseas tener más control sobre el proceso de generación.

REALIZACIÓN DEL VIDEO DEL DÍA DESPLÁCETE PARA CONTINUAR CON EL CONTENIDO

Hay docenas de generadores de texto a imágenes con IA gratuitos y de código abierto disponibles en Internet que se especializan en tipos específicos de imágenes. Entonces, revisamos la pila y encontramos los mejores generadores de texto a imagen con IA de código abierto que puedes probar ahora mismo.

1 Lápiz de color

Craiyon es uno de los generadores de imágenes de IA de código abierto de más fácil acceso. Está basado en DALL-E Mini y, si bien puedes clonar el repositorio de github e instale el modelo localmente en su computadora, Craiyon parece haber abandonado este enfoque en favor de su sitio web.

El repositorio oficial de Github no se ha actualizado desde junio de 2022, pero el último modelo todavía está disponible de forma gratuita en sitio oficial de Craiyon . Tampoco hay aplicaciones para Android o iOS.

En términos de funcionalidad, verá todas las opciones habituales que espera de un generador de imágenes de IA. Una vez que ingrese su mensaje y obtenga una imagen, puede usar la función mejorada para obtener una copia de mayor resolución. Hay tres estilos para elegir: Arte, Fotografía y Dibujo. También puedes seleccionar la opción 'Ninguno' si quieres que el modelo decida.

Además, el 'Modo Experto' le permite incluir palabras negativas, lo que le indica al modelo que evite elementos específicos. También hay una función de predicción de mensajes, que utiliza ChatGPT para ayudar a los usuarios a escribir los mensajes mejores y más detallados posibles. Por último, las funciones de eliminación de fondo impulsadas por IA pueden ayudarle a ahorrar tiempo y esfuerzo al recortar fondos de las imágenes.

Y eso es todo lo que hace Craiyon. No es el modelo de generación de imágenes con IA más sofisticado, pero funciona bien como modelo básico si no quieres algo detallado o realista.

El modelo es de uso gratuito, pero los usuarios gratuitos están limitados a nueve imágenes gratuitas a la vez en un minuto. Puede suscribirse a sus niveles Supporter o Professional (con un precio de y por mes, respectivamente, y facturados anualmente) para no obtener anuncios ni marcas de agua, una generación más rápida y la opción de mantener privadas las imágenes generadas. Un nivel de suscripción personalizado también permite modelos personalizados, integración, soporte dedicado y servidores privados.

2 Difusión estable 1.5

Stable Diffusion es quizás uno de los modelos de generación de texto a imagen de código abierto más populares. También alimenta otros modelos, incluidos los tres generadores de imágenes que se mencionan a continuación. Fue lanzado en 2022 y ha tenido muchas implementaciones desde entonces.

¿Puedes ver quiénes son tus suscriptores en youtube?

Te ahorraré los detalles demasiado técnicos de cómo funciona el modelo (para lo cual puedes consultar su repositorio oficial de Github ), pero el modelo es fácil de instalar incluso para principiantes y funciona bien siempre que tengas una GPU dedicada con al menos 4 GB de memoria. También puedes acceder Difusión estable en línea, y lo tenemos cubierto si desea ejecutar Difusión estable en una Mac .

Hay varios puntos de control (considérelos versiones) disponibles para usar en Difusión estable. Mientras probamos la versión 1.5, versión 2.1 También está en desarrollo activo y es más preciso.

Yadullah Abidi/MakeUseOf/DreamShaper

Ejecutar el modelo también es bastante fácil. Lo probamos con el AUTOMATIC1111 Interfaz de usuario web de difusión estable , y todos los controles y parámetros funcionan bien. También es bastante resistente a NSFW, cortesía de la base de datos LAION-5B en la que se entrenó el modelo (aunque no es perfecta, claro está). Si bien el tiempo de generación variará según su hardware, puede esperar que sus imágenes sean detalladas y realistas incluso con indicaciones básicas.

3 DreamShaper

DreamShaper es un modelo de generación de imágenes basado en Stable Diffusion. Fue pensado como una alternativa de código abierto a MidJourney y se centra en el fotorrealismo en las imágenes generadas, aunque puede manejar estilos de anime y pintura igual de bien con algunos ajustes.

El modelo es más capaz que Stable Diffusion, lo que permite a los usuarios más libertad sobre el resultado final, desde mejoras relámpago hasta restricciones NSFW más flexibles. Ejecutar el modelo también es fácil, con un versión descargable y previamente entrenada disponible en línea para acceso local y una gran cantidad de sitios web, incluidos Sinkin.ai , Semilla aleatoria , y Mage.space (requiere una suscripción básica) que le permite ejecutar el modelo con aceleración de GPU.

comparación-difusión-estable-formador-de-sueños

Como probablemente ya puedas adivinar, las imágenes generadas por DreamShaper tienden a parecer más realistas en comparación con Stable Diffusion. Incluso si ejecuta el mismo mensaje en ambos modelos, el modelo DreamShaper probablemente será más realista, detallado y mejor iluminado.

Esto es especialmente cierto para retratos o personajes, algo que encontré que carecía de Difusión estable en comparación con el mismo mensaje. Si tus imágenes se vuelven demasiado realistas, aquí tienes Cuatro formas de identificar una imagen generada por IA .

Tampoco necesitas una PC gigante para ejecutar el modelo. Mi GTX 1650Ti con 4GB VRAM ejecutó el modelo perfectamente. El tiempo de generación fue un poco más largo, pero no pareció afectar la producción real. Dicho esto, es posible que necesites GPU con más VRAM para ejecutar DreamShaper XL, que se basa en el modelo Stable Diffusion XL.

4 Invocar AI

Invoke AI es otro modelo de generación de imágenes basado en IA basado en Stable Diffusion, con una versión XL basada en Stable Diffusion XL. También tiene su propia interfaz de usuario web y de línea de comandos, lo que significa que no tendrá que saltarse obstáculos con cosas como la interfaz de usuario web de Stable Diffusion.

El adaptador inalámbrico de Windows 10 no funciona

El modelo se centra en permitir a los usuarios crear imágenes basadas en su propiedad intelectual con flujos de trabajo personalizados. InvokeAI es uno de los mejores modelos de generación de imágenes de IA de código abierto para entrenar modelos personalizados y trabajar con propiedad intelectual.

Es repositorio oficial de Github enumera dos métodos de instalación: instalar a través del instalador de InvokeAI o usar PyPI si se siente cómodo con una terminal y Python y necesita más control sobre los paquetes instalados con el modelo.

Sin embargo, el control adicional trae algunas limitaciones, sobre todo requisitos de hardware más estrictos. InvokeAI recomienda una GPU dedicada con al menos 4 GB de memoria, y se recomiendan de seis a ocho GB para ejecutar la variante XL. Los requisitos de VRAM se aplican tanto a las GPU AMD como a Nvidia. También necesitarás al menos 12 GB de RAM y 12 GB de espacio libre en disco para el modelo, sus dependencias y Python.

Yadullah Abidi/MakeUseOf/InvokeAI

Si bien la documentación no recomienda las GPU GTX 10 Series y 16 Series de Nvidia por su falta de memoria de video, el instalador provisto funcionó bien. Si bien su kilometraje puede variar, si tiene una GPU de gama baja, espere más tiempo para ver sus indicaciones convertidas en imágenes. Finalmente, si estás en Windows, solo puedes usar una GPU Nvidia, ya que actualmente no hay soporte para GPU AMD.

transferir archivos de pc a android wifi direct

En la parte de generación de imágenes, el modelo tiende a inclinarse más hacia estilos artísticos que hacia el fotorrealismo. Por supuesto, puede entrenar el modelo en su conjunto de datos y hacer que genere imágenes más cercanas a lo que desea, incluso si se trata de imágenes fotorrealistas, especialmente si trabaja en diseño de productos, arquitectura o espacios comerciales. Sin embargo, una cosa importante a tener en cuenta es que InvokeAI es principalmente un motor de generación de imágenes, lo que significa que probablemente tendrá que usar sus propios modelos para obtener los mejores resultados (que se encuentran fácilmente a través del administrador de modelos proporcionado en la interfaz web) como valor predeterminado. El modelo es bastante similar al propio Stable Diffusion.

5 viaje abierto

Openjourney es un modelo de generación de imágenes de IA gratuito y de código abierto basado una vez más en Stable Diffusion. Si te preguntas por qué el modelo se llama Openjourney, es porque fue entrenado con imágenes de Midjourney y puede imitar su estilo en las imágenes que genera.

héroe rápido , la empresa detrás de Openjourney, le permite probar el modelo junto con otros modelos, incluidos Stable Diffusion (versiones 1.5 y 2), DreamShaper y Realistic Vision. Al registrarte, obtienes 25 créditos gratis (un crédito por cada imagen generada), después de lo cual debes suscribirte a su nivel de suscripción Pro, que cuesta al mes y te da acceso a 300 créditos cada mes con otras características exclusivas.

comparación-difusión-estable-openjourney

Sin embargo, si desea ejecutarlo localmente y de forma gratuita, puede descargue el archivo del modelo de HuggingFace y ejecútelo usando la interfaz de usuario web de Stable Diffusion. Openjourney es también el segundo modelo de generación de imágenes de IA más descargado en HuggingFace, justo detrás de Stable Diffusion.

Openjourney no enumera ningún requisito de hardware específico para ejecutar el modelo localmente en su sitio web, pero puede esperar requisitos de hardware similares a los de Stable Diffusion. Esto significa una GPU dedicada con 4 GB de VRAM, 16 GB de RAM y alrededor de 12 a 15 GB de espacio libre en su computadora para guardar el modelo y sus dependencias.

Yadullah Abidi/MakeUseOf/OpenJourney

Las imágenes generadas por Openjourney tienden a tener un equilibrio entre fotorrealismo y arte, a menos que se especifique lo contrario. Si buscas un modelo versátil y prefieres la apariencia de Midjourney sin pagar la suscripción, Openjourney es una de las mejores opciones.