N.º 2825 – Mes de la IA: DragGAN
21 de mayo de 2023 por Craig Shames
La IA generativa que le permite crear imágenes a partir de indicaciones de texto fue solo el comienzo. Ahora puede seguir editando una imagen existente en tiempo real simplemente haciendo clic y arrastrando el mouse.
Como El borde el plato:
“No, aún no ha terminado: la capacidad de las herramientas de IA para manipular imágenes continúa creciendo. El último ejemplo es hasta ahora solo un documento de investigación, pero muy impresionante, que permite a los usuarios simplemente arrastrar y soltar elementos de una imagen para cambiar su apariencia.
No suena demasiado emocionante a primera vista, pero eche un vistazo a los ejemplos a continuación para tener una idea de lo que puede hacer este sistema.
No solo puede cambiar las dimensiones de un automóvil o manipular una sonrisa con el ceño fruncido con un simple clic y arrastrar, sino que también puede rotar el sujeto de una imagen como si fuera un modelo 3D, cambiando la dirección hacia la que mira alguien, por ejemplo. . Una demostración incluso muestra al usuario ajustando los reflejos en un lago y la altura de una cadena montañosa con solo unos pocos clics. »
🔥 Mueve lo que quieras 🔥
Pasé un año al estilo de Nostradamus, prediciendo cuándo las imágenes generadas por IA permitirían la edición en tiempo real. Sin embargo, ver que se hizo realidad me dejó atónito.
Enlace y detalles 🧵👇 pic.twitter.com/8dB5obQDP1
— Javi López ⛩️ (@javilopen) 20 de mayo de 2023
80.lv explica más:
“Un grupo de investigadores publicó recientemente un artículo que presenta DragGAN, una técnica innovadora para manipular imágenes generadas. Este método permite a los usuarios arrastrar puntos de forma interactiva en las imágenes para lograr un posicionamiento preciso en los puntos de destino.
El método tiene dos elementos clave. El primer componente es la supervisión de movimiento basada en características, que guía el movimiento del punto de control a la posición deseada. El segundo componente implica un nuevo enfoque de seguimiento de puntos que utiliza características GAN discriminatorias para ubicar continuamente las posiciones de los puntos de control.
Con DragGAN, las personas pueden distorsionar imágenes de manera flexible mientras mantienen el control total sobre la ubicación de los píxeles. Esto permite la manipulación de varias categorías, como animales, automóviles, humanos, paisajes, etc., lo que permite realizar ajustes en la pose, la forma, la expresión y el diseño.
Como un verdadero dragón esta nueva herramienta es total 🔥🔥🔥.
¿Es DragGAN la mejor idea de todos los tiempos?
Así:
Me gusta cargar…
Relacionado
Publicado en IA | Deja un comentario