Por qué las IA generativas de imágenes no pueden sustituir a los ilustradores científicos según los expertos de Illustraciencia

A pesar de llevar desarrollándose desde hace décadas y estar integrada en aplicaciones tan cotidianas como la barra de nuestro buscador, no hace tantos meses que la inteligencia artificial irrumpió en nuestras vidas con la contundencia de un tsunami.

Y es que, literalmente, lo ha inundado todo: las redes sociales, tanto personales como institucionales, sumergen nuestro feed en un mar de imágenes generadas por Midjourney, Dall-E, Leonardo y otras herramientas similares al alcance de cualquiera y de todos los bolsillos.

Ante esta situación, numerosas empresas se cuestionan por qué contratar un ilustrador cuando pueden crear todo el contenido visual imaginable a golpe de prompt y a coste cero. Sin embargo, desde Illustraciencia, una iniciativa internacional que promueve la ilustración científica desde hace más de 15 años, se plantean si es esto cierto.

Por una parte, la legislación relacionada con el uso de imágenes generadas por IA es todavía difusa, sino inexistente. Tal como apunta Natalia Esteve Manasanch, abogada experta en propiedad intelectual y derechos de autor, su uso podría incurrir en una infracción de derechos de terceros. Esto se debe a la propia naturaleza de las IA generativas, entrenadas a partir de una inmensa cantidad de imágenes que, muy posiblemente, no disponen de los derechos de autor necesarios para utilizarlas. Esta, de hecho, es una de las principales reivindicaciones de ilustradores y creativos.

Por otra, estos últimos señalan numerosos problemas en la calidad de las imágenes generadas con IA, siendo uno de los más acuciantes su baja precisión. Según Hugo Salais, docente de ilustración digital en la Academia Illustraciencia, “las IAs son capaces de cuidar la imagen a nivel general, pero no al detalle. Por eso aún hoy se lían tanto con algo tan prevalente como las manos humanas”.

A la baja especificidad se suma el hecho de que las IAs generativas se entrenan con imágenes que siempre van a sufrir sesgos dependientes de los humanos y que van a influir en los resultados. Uno de ellos, por ejemplo, sería la “popularidad” de los temas sobre los que queremos obtener imágenes: “Si buscas una imagen de una chica atractiva, obtendrás un resultado casi indistinguible de una fotografía real. Si quieres el retrato de un león, seguramente también conseguirás resultados muy satisfactorios. Pero si intentas crear una imagen de una rata topo calva, obtendrás resultados muy locos que nada tienen que ver con esa especie en concreto”— Ejemplifica el experto en infografía científica de la Academia Illustraciencia Román García.

El escándalo de la revista científica Frontiers

Para locas, las ilustraciones incluidas en un artículo publicado en la revista Frontiers in Cell Developmental Biology el pasado 13 de febrero de 2024, generadas por inteligencia artificial.

En dicha publicación, podíamos encontrar interacciones moleculares falsas, cultivos celulares que parecían tumores alienígenas y anotaciones y etiquetas textuales que realmente no constituían palabras inteligibles. ¿Lo más sorprendente? Una imagen de una rata con un pene gigante y tres testículos sin ningún sentido anatómico, biológico ni textual.

Diagrama de una rata generado por IA sin rigor científico publicado en la revista Frontiers in Cell Developmental Biology 2024. Ilustración: Guo et al.

Tal como nos cuenta Vanessa González, ilustradora científica y doctora en ciencias del mar, los artículos científicos que se postulan para ser publicados en una revista científica suelen pasar por varios filtros de calidad. Estos son los propios editores y generalmente tres revisores expertos en el tema sobre el que trata el artículo. Los investigadores no tienen porqué saber si las ilustraciones son hechas por IA o no, pero sí deberían detectar si son poco rigurosas o contienen errores. En algunos casos es fácil saberlo por los textos sin sentido o errores evidentes en el dibujo, como en este caso”.

De hecho, es tan fácil saberlo que, pocos días tras su publicación, la revista retiró el artículo ante la avalancha de críticas por parte de los lectores, lo cual ha supuesto un duro golpe a su autoridad y prestigio. ¿Por qué arriesgarse a ello?

Todos los ilustradores que han participado en este artículo coinciden: la generación de imágenes por IA es un recurso de lo más rentable para aquellos que no disponen de conocimientos ni habilidades artísticas y tampoco quieren dedicar tiempo ni dinero a crear una imagen que va a recibir tan solo unos segundos de atención en la redes o que solo atañen a la ilustración un papel decorativo. 

Tal como explica la ilustradora arqueológica y docente de Illustraciencia Andrea Menéndez, “la IA permite ahora a gente sin experiencia o conocimientos específicos en dibujo o programas especializados generar ilustraciones que, aunque puedan tener carencias científicas a ojos expertos, son visualmente satisfactorias o suficientes para la mayor parte del público”. 

“Podría llegar a argüirse que esto sea suficiente en algunos ámbitos, pero no cuando la imagen ha de tener un objetivo didáctico o divulgativo, o cuando la empresa o institución que requiere la imagen se guía por esos valores.” —señala Hugo Salais.

Ilustración de una de las postales de la campaña de San Valentín del Organismo Autónomo Parques Nacionales (OAPN), criticada por su falta de rigor científico.

Ni el mejor prompt puede integrar la información de una docena de artículos científicos”

Y es que, en el campo de la ilustración científica, el rigor adquiere un papel absolutamente imprescindible. Para profesionales como Román García, Vanessa González, Hugo Salais y Andrea Menéndez, la IA constituye una herramienta de apoyo para acelerar determinados procesos y obtener una base sobre la que seguir trabajando.

“Como otros softwares y medios que surgieron en las últimas décadas del siglo XX, la IA es indudablemente una herramienta válida y útil que es interesante saber manejar para conocer el potencial que puede representar en tu flujo de trabajo” —comenta Menéndez.

“La IA es una herramienta más a nuestra disposición para resolver las tareas que surgen durante la producción de una ilustración, como lo es la fotografía o las técnicas digitales”. Román García utiliza la IA sobre todo en fases iniciales como el boceto o la conceptualización, a modo de referencia. ¿Quién no ha recurrido a plataformas como Pinterest o Google Imágenes durante su proceso creativo? También la usa para explorar posibles composiciones, iluminaciones y paletas de color: “Normalmente, el nivel de precisión que necesitamos en ilustración científica impide que podamos usar las imágenes generadas por IA tal cuál salen del modelo. Siempre es necesaria una edición por nuestra parte para conseguir el rigor esperado en nuestro trabajo.”

Escena Sierra Nevada y Luna Io. Ilustración de Román García. Imágenes generadas con Midjourney usadas para componer la imagen final con técnicas básicas de fotocomposición y overpainting en Photoshop.

Asedio Zbarazh. Ilustración de Roman García. 2023, Desperta Ferro Ediciones. 1) Bloqueo 3D del espacio; 2 y 3) Personajes generados con Midjourney; 4) Boceto para corregir los personajes y unificar todos los elementos; 5) Imagen final. 

Por otra parte, como ya comentamos anteriormente, la IA necesita un inmenso repositorio de imágenes preexistentes para representar un elemento determinado. Sin embargo, cuando hablamos de ilustración científica, a menudo lo que se busca es ilustrar contenidos novedosos para los que no existe material de referencia suficiente, tal como nos relata Salais: “Uso IAs como Midjourney en ciertos proyectos que contienen partes genéricas o inespecíficas y que la IA me puede ayudar a conceptualizar de forma integrada, como el entorno, la iluminación o el ángulo de una escena paleoartística con un organismo extinto. Pero pedirle a la IA que reconstruya al organismo sería impensable. La reconstrucción paleoartística consiste en extraer el aspecto en vida de un organismo a partir de una referencia indirecta como es el registro fósil a través de un proceso complejo que hoy las IAs no están diseñadas para seguir.”

“El problema es que la IA no tiene la capacidad de entender lo que está dibujando. Solo el día en que se pueda meter en un ordenador una muestra de agua y pedirle a la IA que la compruebe, dibuje todas las especies que detecte en ella, las disecciones y dibuje sus órganos internos podrá sustituirnos” —señala Vanessa González

García explica que un equipo de investigadores es capaz de resumirte varias docenas de artículos científicos en una charla de una hora y media para que entiendas qué necesitan ilustrar. Luego tú tienes que sintetizar toda esa información en forma de imágenes, usando las referencias que esos investigadores han puesto a tu disposición y entendiendo el conjunto de forma orgánica. Por último, debes aplicar sus comentarios y sugerencias para que la imagen transmita exactamente el mensaje deseado. Esto es mucho más complejo que los prompts que son capaces de entender los modelos actuales”.

En conclusión: las IAs son una herramienta más a nuestra disposición para mejorar nuestros procesos de trabajo pero, al menos por ahora, no disponen de una legislación que asegure los derechos de autor de las imágenes utilizadas en su entrenamiento ni pueden sustituir el trabajo de un ilustrador científico.
Y es que, tal como sentencia Román García,ni el mejor prompt puede integrar la información de una docena de artículos científicos”.

Salir de la versión móvil