Taller Semana de la IA 2025
Iris Domínguez Catena
iris.dominguez@unavarra.es
La generación de imágenes es cada vez más simple, gracias a los modelos multimodales.
Objetivo: Que salgas creando contenido visual de calidad, sabiendo qué estás haciendo.
La Inteligencia Artificial intenta imitar capacidades humanas. Hay varios tipos:
La IA generativa ha explotado gracias a:
Proceso de entrenamiento:
Ejemplo: Imagenet, el conjunto de datos con el que empezó todo.
Stable Diffusion es un modelo popular para crear imágenes. Durante el entrenamiento, el modelo aprende solo a eliminar ruido de imágenes. Eventualmente, parte de imágenes de estática pura para generar contenido plausible.
La magia reside en los controles: texto, otras imágenes...
Cuando le pedimos a Stable Diffusion que cree una imagen, aplica el proceso aprendido en orden inverso: empieza con ruido aleatorio y lo va transformando progresivamente hasta obtener una imagen coherente.
El prompt es crucial: cuanto mejor lo escribamos, mejor será la imagen.
Los modelos de IA pueden "personalizarse" para tareas específicas:
Con LoRA de estilo A
Con LoRA de estilo B
Explora diferentes estilos:
Sí, aunque cada vez menos. La mayoría de modelos de IA se entrenan principalmente con datos en inglés.
Recomendación: Escribe tus prompts en inglés para mejores resultados.
🇪🇸 "Un gato jugando al ajedrez bajo la luz de la luna"
🇬🇧 "A cat playing chess under moonlight"
Herramientas de traducción:
Hoy usaremos Google Gemini para generar imágenes.
Ventajas:
Cómo usarlo:
❌ Prompt vago:
"un paisaje bonito"
✅ Prompt detallado:
"mountain landscape, golden hour, misty valleys, pine trees, dramatic clouds, mirrorless camera, wide angle, vibrant colors, photorealistic, 4k"
Recursos:
Estilo "escopeta": En lugar de escribir frases completas como si hablaras con una persona, escribe palabras clave separadas por comas. Ejemplo: "sunset, ocean, palm trees, warm colors" en vez de "I want to see a beautiful sunset over the ocean with palm trees".
Sé específico con los detalles: Cuanta más información des sobre iluminación, colores, estilo artístico y perspectiva, mejor será el resultado. Por ejemplo, especifica "golden hour lighting, vibrant colors, wide angle shot" en lugar de solo "buena iluminación".
Menciona el tipo de cámara: Esto ayuda a definir el realismo de la imagen. Usa "mirrorless camera" o "DSLR" para resultados fotorrealistas profesionales, o "phone camera" para un aspecto más casual y amateur.
Referencias artísticas: Puedes nombrar artistas específicos, fotógrafos famosos o movimientos artísticos para lograr un estilo particular. Ejemplos: "Ghibli style", "in the style of Ansel Adams", "impressionist painting". Menciona más de un estilo para guiar al modelo sin robar descaradamente.
Añade atmósfera y sensaciones: Adjetivos que describan el ambiente emocional ayudan mucho: "melancholic", "energetic", "mysterious", "serene", "dramatic".
Importante: Más detalles generalmente significa mejor resultado, pero la IA no reflejará todos los detalles que incluyas. Algunos inevitablemente se perderán o interpretarán de forma diferente.
Limitación común: La IA todavía tiene dificultades posicionando objetos correctamente y estableciendo relaciones espaciales entre ellos.
Planos según escala:
Planos según ángulo:
Tiempo: 30 minutos
Genera dos imágenes de "un gato en la luna":
Primera versión: Prompt simple, directo.
Segunda versión: Prompt detallado (añade detalles de estilo, iluminación, atmósfera...)
Compara: ¿Qué diferencias notas? ¿Cuál prefieres y por qué?
Intenta pedirle que edite la primera imagen con la información extra de la segunda, en varios pasos. ¿Se logra una imagen igual que cuando damos toda la información desde el primer prompt?
Genera 2-3 imágenes usando el generador aleatorio:
Ejemplo: acuarela
Ejemplo: fondo abstracto
Tip: ¿Cómo puedes hacer que estas imágenes destaquen?
Cada vez somos más difíciles de impresionar, así que tendrás que jugar con elementos extra para lograr resultados interesantes.
¿Qué es el inpainting? Modificar partes específicas de una imagen usando IA.
Antes: Teníamos que elaborar una máscara, dibujar en la imagen qué áreas se podían cambiar.
Hoy en día: Es un proceso iterativo. Podemos pedirle al modelo que altere directamente una imagen.
Consejo clave: Muchas veces es más fácil partir de una imagen real y modificarla, que generar una desde cero.
Ejemplo de uso:
Es un equilibrio entre calidad (todo en un solo prompt) y control (prompts iterativos centrados en cada elemento).
Vamos a crear una composición compleja combinando elementos:
El reto: Pedirle a la IA que genere una imagen que combine:
Ejemplo de prompt:
"A elderly woman with grey hair and glasses, holding a vintage camera, standing in a library filled with old books, warm lighting, photorealistic, detailed"
Desafío adicional: ¿Consigues que la IA represente correctamente las tres cosas a la vez? Esta es una de las limitaciones actuales de la IA.
¿Qué pueden hacer las herramientas actuales?
Ejemplo de tecnología punta: Sora de OpenAI
Limitaciones:
Hoy usaremos una de estas dos:
Hedra (hedra.com)
Kling (klingai.com)
Elige la que más te interese y crea una cuenta.
✨ Vídeos generados desde cero (text-to-video):
En general, merece la pena al menos usar primero text-to-image para generar un frame de control
🎬 Vídeos mixtos (con fragmentos generados por IA):
Hoy haremos: Un proyecto de vídeo mixto, combinando contenido real con un final generado por IA.
Ejemplo de vídeo mixto creativo:
Vamos a hacer algo creativo con los recursos disponibles:
La idea: Tomar un vídeo real y darle un final completamente diferente usando IA.
Ejemplo:
Tiempo estimado: Este proceso puede tardar 15-20 minutos (incluyendo esperas de generación).
Tiempo: 25 minutos
Cada vez es más difícil distinguir contenido real de generado por IA.
Realidad actual: Hoy en día, la detección es virtualmente imposible en muchos casos.
En imágenes:
En vídeos:
Ejercicio revelador: Genera imágenes de "nurse" y "doctor" en inglés.
¿Qué género predomina en cada profesión?
¿Por qué pasa esto?
La IA aprende de internet, que refleja sesgos sociales existentes. Compara los resultados de búsqueda en:
Si la mayoría de imágenes de "enfermera" muestran mujeres, la IA aprende ese patrón. Lo mismo ocurre con razas, edades, contextos culturales... Explora este artículo de Bloomberg.
Importante: Sé consciente de estos sesgos. Puedes contrarrestarlos siendo específico en tus prompts ("male nurse", "female CEO", etc.).
¿Qué es un deepfake? Vídeo o audio falso creado con IA que parece real.
Casos destacados:
¿Qué podemos hacer?
Áreas de riesgo:
Situación legal actual (2025):
Advertencia importante:
¿Quién es dueño de una imagen generada por IA?
Buenas noticias: Steamboat Willie (1928) ya es de dominio público desde 2024
Herramientas gratuitas:
Aprendizaje y ejemplos:
Utilidades:
Recuerda: La IA es una herramienta.
Tú eres quien le da propósito y dirección.