Como pueden impulsar la innovación los sistemas de Inteligencia Artificial que crean imágenes a partir del lenguaje natural
Un Manifiesto de Acción
Soy muy fan de Luis Perez-Breva y su libro “Innovar. Un Manifiesto de Acción”. Tan fan que tengo dos copias del libro, una en inglés y otra en español, solo para asegurarme de que nada se pierde en la traducción. Incluso cursé su Curso de MIT Professional Education.
Lo que encuentro más atractivo del enfoque a la innovación de Pérez-Breva es su concepto del “presentimiento”.
Cuando nos enfrentamos a los retos de la innovación, muchos de nosotros nos sentimos angustiados con el proceso de ser creativo y tener ideas originales y buenas.
Pérez – Breva nos urge a liberarnos de la presión de tener que pensar en algo nuevo de entrada. Nos invita a empezar con un “presentimiento”, una intuición sencilla a cerca de algo que tiene pinta de no estar bien. Algo que podría mejorarse, algo que supone un problema.
Solemos considerar innovación como el acto de proponer una idea (la innovación) que con suerte resolverá un problema. De hecho innovar es un verbo, es el acto de enfrentarse a un problema para encontrar, con suerte, una solución.
Pero ¿como y donde encontramos esos presentimientos?. Pérez-Breva sugiere encontrar inspiración en la ciencia ficción, en la negación de cosas que damos comúnmente por hecho y en atreverse a hacer combinaciones absurdas.
Una combinación absurda consiste en inquirir sobre al menos dos cosas que se suponen, hasta ahora, que no van juntas. La combinación de una cámara y un teléfono habría sido absurdo para muchos de nosotros en los años 80, por ejemplo.
El poder de una combinación absurda no es la combinación en sí. Su poder proviene del trabajo empleado en intentar hacer tangible esa combinación absurda. Y aquí es donde la IA (Inteligencia Artificial) nos puede ayudar.
Inteligencia Artificial aplicada a la Innovación
En los últimos meses hemos visto como se han vuelto más accesibles sistemas de Inteligencia Artificial que crean imágenes a partir de lenguaje natural como Stable Diffussion o DALL-E.
La sencilla descripción (en inglés) “Un minion y su novia en una playa de las Bahamas“, me proporcionó en segundos la imagen siguiente:

Resulta fácil pensar en reemplazar esos post-it de 3 palabras que usamos en sesiones de design thinking o lluvia de ideas por una representación más visual y tangible de la idea que tenemos en la cabeza.
Pero estas herramientas nos sirven también para descubrir combinaciones entre conceptos disconexos, reducir el bloqueo creativo y estimular el pensamiento fuera de la caja. Generé estas 9 imágenes con la descripción “una bicicleta antigravitatoria volando por el cielo” en DreamStudio:









Obtuve esta galería de imágenes que pueden ayudarnos a hacer tangible el concepto de “bicicleta antigravitaroria” y a mirar en distintas direcciones. Detrás de las imágenes 5 y 6 parece intuirse una bicicleta lanzada con un tirachinas o desde una rampa. Las figuras 2, 3 y 7 sugieren investigar como ponerle alas a una bicicleta. La imagen 8 parece una bici con cohetes, la imagen 9 con un globo. No se que pensar de la imagen 4 (¿un dron bicicleta?) pero la figura 1 me invita a pensar en una fuente externa de movimiento, magnético, antigravitarorio, …
Muy probablemente las respuestas anteriores no habrían sido muy distintas de las que se obtendrían en una sesión de lluvia de ideas. Estas se han obtenido en segundos por una única persona.
Innovar a base de trastear y jugar con la Inteligencia Artificial
Ni siquiera es necesario empezar con una combinación trabajada de palabras. Supongamos que empezamos por “Naranja Mecánica”.









Los resultados no son sorprendentes porque “La Naranja Mecánica” es un icono en la cultura popular y debe haber miles de imágenes relacionadas en la base de datos de IA. Pero a partir de ahí de puede trastear con las palabras y obtener otros resultados. ¿Que tal reemplazar naranjas por otras frutas?:



Por alguna razón el “pepino” a capturado mejor la vertiente límite de “La Naranja Mecánica”.
Se pueden añadir palabras como: “Naranja Mecánica en esteroides”:




¿Alguna vez te has preguntado como sería unas “azafatas de vuelo anestesistas”?. Pues bastante parecido a varias anestesistas en un avión:



¿Y que hay de un “zapato que aproveche la energía solar”?:

¿Y un “zapato con funcionalidades de iwatch”?:



Conclusiones
Ninguna de las imágenes anteriores es una innovación. Solamente son los primeros pasos a partir de una presentimiento. Pasos que nos ayudan a hacer el presentimiento tangible y a reducir la carga de la creatividad. Hacen que nuestra mente discurra por caminos que podríamos no haber considerado al principio.
Esto es lo que obtuve para un “armario lavadora”:

El sistema me devolvió un armario y una lavadora. Pero también me devolvió ésta otra:

que podría llevar a pensar en que el armario (de alguna manera) hiciese a la vez de lavadora. Alimentas el sistema de IA con descripciones y el sistema de devuelve varias imágenes para que trabajes con ellas y avances un paso.
Al final estos sistemas de Inteligencia Artificial están basados en millones de imágenes que ya existen en el mundo. Pero así es justo como funciona la innovación, a través de la combinación de partes existentes de nuevas maneras.
Como le gusta a decir a Pérez-Breva, “Nada es nuevo al principio de lo que solo más adelante celebramos como innovación”.
Nota final:
Me gustaría agradecer a Javi López por compartir públicamente su trabajo con imágenes generadas por IA, que inspiró esta combinación absurda entre él y Luis Pérez-Breva. La imagen de portada de esta entrada “Cthultu en el campus del MIT en una noche oscura y lluviosa” es un tributo a su libro y novela ilustrada (que acabo de comprarme).