Estética artificial - Emanuelle Arielli - E-Book

Estética artificial E-Book

Emanuelle Arielli

0,0

Beschreibung

La inteligencia artificial ha irrumpido en nuestras vidas con una fuerza arrolladora. Y el auge de la IA generativa está afectando también a un ámbito que cabía pensar a salvo de su influencia: el de la creación artística. Nuestros conceptos habituales de estética o diseño están cambiando, nos vemos obligados a cuestionarnos la naturaleza del acto creativo, de la autoría, de la idea de originalidad. ¿Será posible que las máquinas generen una estética propia? Partiendo de una larga experiencia teórica y práctica en este campo, y con un enfoque multidisciplinar que va de la filosofía y la psicología del arte a la teoría de los medios o la ciencia de datos, este apasionante libro ofrece una sorprendente y esclarecedora visión de conjunto de un tema de máxima actualidad que, sin embargo, está dominado por generalidades y lugares comunes. Un texto que da un vuelco radical a cualquier idea preconcebida que el lector pudiera tener al respecto.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 366

Veröffentlichungsjahr: 2025

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Akal / Cultura digital

Director de la colección: Juan Martín Prada

Diseño cubierta: RAG

Motivo de cubierta: Lev Manovich, imagen generada con la versión 3 de Midjourney (2022)

Queda prohibida la reproducción, plagio, distribución, comunicación pública o cualquier otro modo de explotación –total o parcial, directa o indirecta– de esta obra sin la autorización de los titulares de los derechos de propiedad intelectual o sus cesionarios. La infracción de los derechos acreditados de los titulares o cesionarios puede ser constitutiva de delito contra la propiedad intelectual (artículos 270 y siguientes del Código Penal).

Ninguna parte de este libro puede utilizarse o reproducirse de cualquier manera posible con el fin de entrenar o documentar tecnologías o sistemas de inteligencia artificial.

Nota a la edición digital:

Es posible que, por la propia naturaleza de la red, algunos de los vínculos a páginas web contenidos en el libro ya no sean accesibles en el momento de su consulta. No obstante, se mantienen las referencias por fidelidad a la edición original.

Título original

Artificial Aesthetics: Generative AI, Art and Visual Media

© Emanuelle Arielli y Lev Manovich, 2025

© Ediciones Akal, S. A., 2025

Sector Foresta, 1

28760 Tres Cantos

Madrid - España

Tel.: 918 061 996

[email protected]

www.akal.com

facebook.com/EdicionesAkal

@ediciones_akal

@ediciones_akal

@AkalEditor

ISBN: 978-84-460-5666-9

Emanuele Arielli y Lev Manovich

Estética artificial

IA generativa, arte y medios visuales

Traducción de

Jesús Espino Nuño

La inteligencia artificial ha irrumpido en nuestras vidas con una fuerza arrolladora. Y el auge de la IA generativa está afectando también a un ámbito que cabía pensar a salvo de su influencia: el de la creación artística. Nuestros conceptos habituales de estética o diseño están cambiando, nos vemos obligados a cuestionarnos la naturaleza del acto creativo, de la autoría, de la idea de originalidad. ¿Será posible que las máquinas generen una estética propia?

Partiendo de una larga experiencia teórica y práctica en este campo, y con un enfoque multidisciplinar que va de la filosofía y la psicología del arte a la teoría de los medios o la ciencia de datos, este apasionante libro ofrece una sorprendente y esclarecedora visión de conjunto de un tema de máxima actualidad que, sin embargo, está dominado por generalidades y lugares comunes. Un texto que da un vuelco radical a cualquier idea preconcebida que el lector pudiera tener al respecto.

Emanuele Arielli es profesor de Estética en el Istituto Universitario di Architettura de Venecia (IUAV). Sus investigaciones se centran en las conexiones entre la estética, la cognición y los nuevos medios.

Lev Manovich es profesor en The Graduate Center, City University of New York. Sus campos de estudio abarcan el arte digital, los nuevos medios, la teoría de los medios, las humanidades digitales y la cultura visual.

#1 #

Hasta una IA podría hacerlo

Emanuele Arielli

¿Qué es la estética? Pensemos en las muchas decisiones estéticas que tomamos en nuestra vida cotidiana: elegir y combinar la ropa, dar un «me gusta» a fotos, escoger un peinado, maquillarnos, visitar lugares, qué objetos comprar, qué música escuchar, etc. En todos estos ejemplos, la estética hace referencia a experiencias placenteras mediadas por nuestros sentidos. El término también puede incluir conceptos como el de estilo y juicios estéticos que estiman el valor de una obra de arte, aunque la naturaleza de la relación entre estética y arte ha sido objeto de debate en la época contemporánea. También tomamos decisiones estéticas a diario al crear gráficos, tomar y editar fotos y vídeos, dibujar imágenes y diseñar espacios y edificios. La estética abarca experiencias y objetos tanto naturales como hechos por el ser humano.

Desde principios del siglo xxi, la computación, el análisis de datos, el aprendizaje automático, las redes neuronales y la inteligencia artificial (IA) –una etiqueta onmicomprensiva y llamativa cuya definición va cambiando– se han ido introduciendo gradualmente en el ámbito estético. Por ejemplo, servicios de streaming como Spotify, Apple Music o Pandora recomiendan automáticamente música que puede gustarnos. La función «Buscar» de Instagram selecciona de igual modo fotos y vídeos de forma personalizada para cada usuario. La mejora automática con un solo botón es una función estándar en todas las aplicaciones de ordenadores y dispositivos móviles para editar fotos. Las grandes tiendas de moda online ofrecen de forma automática sugerencias de ropa, etcétera.

Fig. 1.1. Pinturas de paisaje chinas realizadas con redes generativas antagónicas

Todos estos sistemas se basan en métodos cada vez más sofisticados para predecir lo que le puede gustar a la gente. Los sistemas de IA, por ejemplo, aprenden principios de calidad estética observando directamente las elecciones que hacen las personas. Las primeras predicciones sobre la calidad de las imágenes se basaban en reglas de composición clásicas (como la de los tercios, la relación de aspecto, la saturación, etc.) y en la intuición de los programadores sobre el valor estético, derivada de su observación de las fotografías que más gustaban[1]. Más tarde, las redes neuronales se utilizaron progresivamente para asignar etiquetas semánticas («significados») y extraer de forma automática características estéticamente relevantes mediante el análisis de grandes bases de datos de imágenes marcadas con un «me gusta»[2].

Además de las recomendaciones y la edición automática, la IA se utiliza ahora mucho para generar nuevos artefactos sintéticos, entre otros obras de arte, música, diseños y textos. Por ejemplo, en 2016, un algoritmo de aprendizaje profundo fue entrenado para aprender el estilo de Rembrandt mediante el análisis de sus 346 pinturas conocidas. Posteriormente, se encargó al algoritmo la tarea de generar un retrato completamente nuevo, cuyo resultado tenía un asombroso parecido con un Rembrandt real. Ese mismo año, investigadores de los Sony Computer Science Laboratories de París desarrollaron un sistema de IA llamado DeepBach, que produce cantatas corales en el estilo de J. S. Bach[3]. Desde entonces, se han creado otros algoritmos que generan música. Incluso los vídeos de YouTube invitan a quienes los ven a participar en «tests de Turing» musicales, retándoles a distinguir composiciones creadas por IA de las humanas. Para las personas con cierta formación musical, la tarea sigue pareciendo sencilla, pero para un oyente inexperto no siempre es así[4]. En 2019, Deutsche Telekom reunió a un equipo de expertos internacionales en música e IA para completar la inacabada décima sinfonía de Beethoven, a modo de celebración del 250 aniversario de su nacimiento. La sinfonía terminada, «Beethoven X – The AI Project», se estrenó el 9 de octubre de 2021 en Bonn. Puede resultar difícil seguir el ritmo de algo que progresa tan rápido, ya que los cambios tecnológicos incrementales producen resultados continuamente mejorados: en 2019, una IA utilizó la potencia computacional de un nuevo modelo de smartphone para terminar la Sinfonía n.º 8, Inacabada de Schubert (1822)[5], aunque lo hizo con la ayuda de un compositor que seleccionó las mejores melodías generadas. En 2020, un estudiante de la Universidad de Princeton utilizó una red generativa antagónica (GAN) para realizar pinturas de paisaje tradicionales chinas que eran capaces de engañar a seres humanos en un test de Turing visual (Fig. 1.1)[6].

El encuentro entre la IA y la estética es crucial, porque la estética se considera un ámbito esencialmente humano. Durante mucho tiempo, no parecía posible que su dificultad y complejidad pudiesen verse sometidas a una reducción algorítmica. Para algunos, el arte, la estética y la creatividad son la cumbre de las capacidades humanas y, por tanto, representan un último baluarte contra los avances aparentemente imparables de la IA. En otras palabras, este complejo ámbito se convierte en el campo de pruebas definitivo de las posibilidades y limitaciones de la IA.

Aun así, prevalece la opinión de que avances y desarrollos como los mencionados sólo imitan estilos existentes y no son en absoluto creativos. En esos casos, los ordenadores reciben ejemplos preexistentes y generan variantes que se ajustan a sus patrones, al tiempo que intentan introducir algún nivel de variación. A veces tienen un siniestro parecido con las obras de arte auténticas, pero esto también puede que las haga parecer un poco fuera de lugar a un ojo entrenado, carentes de esos toques finales que las harían convincentemente humanas. Estos algoritmos no generan estilos musicales o pictóricos totalmente nuevos, sino que son ejemplos de lo que podríamos llamar manierismo computacional.

Sin embargo, podría ser sólo cuestión de tiempo que hasta los expertos se vean engañados y una IA produzca obras de arte que se consideren estéticamente superiores a sus variantes humanas. Habría que tener en cuenta que los ejemplos antes mencionados se refieren a conjuntos de obras con una buena cantidad de repeticiones y una baja variabilidad: cualidades que permiten a los sistemas de IA extraer características generales y generar nuevos ejemplos con facilidad. En otras palabras, parece especialmente sencillo producir obras de arte tradicionales o clásicas, ya que tienden a mostrar un estilo claro y reconocible, y a seguir los patrones específicos de un artista, una escuela o una tradición. Los sistemas de aprendizaje automático son idóneos para analizar numerosas manifestaciones de un determinado objeto con ligeras variaciones y extraer las características y patrones relevantes. Por el contrario, sería muy difícil reproducir un conjunto de obras como las de Duchamp, ya que la IA tendría que partir del heterogéneo conjunto de datos que constituye la producción de este artista, que abarca la Fuente, el Botellero,El Gran Vidrio, el tardío Étant donnés, etc. Normalmente, las opiniones conservadoras sobre el arte consideran que la maestría técnica es un criterio que define el «verdadero arte», y mucha gente sigue sin considerar arte algo que no requiera una destreza o aptitud técnica. Sin embargo, destreza técnica implica conocimiento procedimental, y las IA están diseñadas para afrontar precisamente este tipo de conocimiento. Los estilos claramente reconocibles son problemas bien definidos que pueden reducirse a tareas computacionales, mientras que la generación de variantes que no siguen reglas de composición (como las obras de Duchamp) da como resultado tareas mal definidas que no tienen una solución procedimental fácil[7]. «¡Eso podría haberlo hecho mi hijo!», el popular cliché con que se despacha al arte contemporáneo, parece volverse ahora, en una irónica inversión, contra el gran arte estilísticamente complejo –pero computacionalmente escalable– de la tradición cultural: hasta una IA podría hacerlo. Es el Duchamp el que queda fuera de las capacidades creativas de la IA, al menos por ahora.

He aquí un breve resumen de las principales cuestiones que nos gustaría tratar.

Una investigación sobre el impacto de la IA y el aprendizaje automático en el ámbito de la estética requiere, en primer lugar, un mapa general de las áreas en las que la estética y los métodos computacionales se encuentran y se relacionan entre sí (véase el siguiente epígrafe, «Un mapa sencillo»). Luego, más adelante, mostraremos algunos puntos de contacto entre la llamada estética experimental y las aplicaciones computacionales, mostrando cómo algunos límites y puntos críticos que se encuentran en la primera pueden trasladarse a los enfoques emprendidos por la segunda (epígrafe «Computación y psicología»).

La tecnología es el desarrollo de herramientas que amplían nuestro alcance y poder. Tenemos una fuerza física biológicamente limitada: gracias a palancas, engranajes y, finalmente, los motores, conseguimos superar estos límites. Tenemos una agudeza visual biológicamente limitada, pero microscopios y telescopios nos permitieron ampliar el reino de lo visible. Del mismo modo, nuestras capacidades cognitivas, como el cálculo y la memoria, tienen límites, pero las calculadoras y las computadoras aumentaron esas capacidades. Siguiendo esta línea de argumentación, se podría sugerir que la capacidad estética también tiene límites humanos, que podría haber un punto en el que se alcanzara la creatividad máxima o la sensibilidad estética máxima. Los límites estarían determinados tanto por el individuo, que tiene su propio nivel de sensibilidad, creatividad y habilidades, como por la cultura en su conjunto, que delimita lo que es posible dentro de un medio artístico específico. La estética artificial puede describirse como un aumento de nuestras aptitudes estéticas, que profundiza tanto en nuestros procesos creativos como en nuestra comprensión y sensibilidad de los artefactos culturales. Los sistemas avanzados serían, entonces, una evolución de dispositivos que ya se utilizan en disciplinas creativas, como los programas gráficos, la tecnología de diseño asistido por ordenador, el software musical, etc. (véanse capítulos posteriores sobre creatividad, teoría de los medios y cultura digital). Si, en un sentido tradicional, los medios son extensiones de los sentidos humanos, entonces la IA es una extensión más de las capacidades humanas a la hora de mediar entre nosotros y el mundo.

Nuestra implicación con la tecnología amplía y modifica nuestra forma de crear y, en última instancia, conforma nuestra evolución cultural. La cuestión que se plantea es si todo esto tiene el potencial de ampliar los límites de nuestro conocimiento sobre el patrimonio cultural y artístico humano. En un escenario futurista, las máquinas podrían comprender de forma precisa las preferencias estéticas humanas, llegando a registrar cómo percibimos y reaccionamos ante un objeto estético con mayor precisión de la que disponen los humanos. Las máquinas podrían aprender a producir artefactos estéticos y generar nuevos géneros y estilos creativos. Al analizar la estética humana y la diversidad estética en la cultura humana, podrían incluso ser capaces de crear nuevas «culturas», es decir, crear tipos de arte y estética auténticamente nuevos.

En los debates en torno a la IA, oímos a menudo cómo las máquinas «resuelven» dominios que creíamos exclusivamente humanos o consiguen mejores prestaciones que sus competidores humanos. En cada ocasión, el listón de lo que debería considerarse un comportamiento verdaderamente humano e inteligente se eleva y se traslada a otros dominios. Vemos –no sin cierta preocupación– cómo parece reducirse el área de lo que consideramos irreproducible por las máquinas. Cabe preguntarse si estamos asistiendo ahora a este proceso reductivo en el ámbito estético. Esto plantea algunas cuestiones: ¿podrían las máquinas llegar a un punto en el que las consideremos verdaderamente creativas? ¿Cómo podrían abordar las máquinas el giro conceptual de los movimientos artísticos contemporáneos? ¿Qué papel podrían desempeñar para ayudarnos a entender el «buen gusto» y el «mal gusto»? ¿Los sistemas que utilizan el análisis de datos aprovechan la estructura «inconsciente» de nuestra cultura, o asistimos a la aparición de una forma totalmente nueva de producción cultural?

La definición original de la estética como disciplina filosófica fue acuñada en 1750 por el filósofo alemán Alexander Baumgarten y hacía referencia al griego antiguo aisthesis, que significa sensación o percepción. Más tarde, Kant redefinió el término en su Crítica del juicio (1790) como el ámbito de los juicios subjetivos del gusto. Esto significaba que la estética trataba la percepción como una noción más compleja que la mera experiencia sensorial (investigada hoy por la psicología de la percepción), ya que también pretendía abordar nuestras respuestas afectivas y cognitivas a la percepción. Las máquinas aprenden a reconocer patrones cada vez más complejos que los humanos no son capaces de detectar. Todo esto plantea la siguiente pregunta: ¿hasta qué punto los mecanismos de percepción y reconocimiento de patrones maquínicos son relevantes para la «percepción estética», y cuáles son los aspectos típicamente humanos de la sensibilidad estética a los que aún se deben enfrentar los sistemas artificiales?

Cómo se relaciona la IA con la estética: un mapa sencillo

Como hemos visto, los enfoques computacionales de la estética abarcan una amplia gama de aplicaciones, desde el análisis de artefactos culturales hasta su generación, abordando cuestiones como:

a) ¿Podemos desarrollar sistemas que extraigan todas las características relevantes de un artefacto o una imagen? ¿Podemos analizar/describir las características estéticas de los artefactos estéticos de una determinada tradición cultural[8]?

Desde otra perspectiva, también nos interesan cuestiones como:

b) ¿Podemos utilizar la IA para comprender (y predecir) lo que le gusta a la gente?

Aquí podemos distinguir entre cuestiones relativas a objetos y otras relativas a sujetos. En cuanto a las primeras, nos centramos en las características formales y expresivas del artefacto (por ejemplo, el estilo de un cuadro, sus motivos, la disposición de formas y trazos, las semejanzas formales con otras obras), así como en su semántica y significado. Por otro lado, cuando abordamos cuestiones relativas a sujetos, nos ocupamos de la percepción y la experiencia estética de los espectadores, incluidos juicios de valor artístico, apreciación, reac­ciones afectivas y cognitivas, etcétera.

El par objetivo/subjetivo distingue dos perspectivas completamente distintas en los enfoques computacionales: la primera se refiere al análisis de objetos y pretende extraer patrones e invariantes estilísticos partiendo de grandes bases de datos de artefactos estéticos y productos culturales. El análisis subjetivo se pregunta qué propiedades de un artefacto guardan relación con (y predicen) las respuestas, sentimientos e interpretaciones estéticas de las personas, tanto individual como colectivamente.

Hay que hacer otra distinción. El aprendizaje automático se utiliza tanto para extraer patrones de los datos como para generar patrones tras el entrenamiento con dichos datos. Por lo tanto, los avances en estas tecnologías no sólo nos permiten describir artefactos y predecir el comportamiento de las personas, sino que también pueden implementarse para generar artefactos y simular el comportamiento de las personas. Por lo tanto, habría que añadir otro tipo de preguntas: ¿podemos (re)producir lo que le gusta a la gente y generar nuevos artefactos estéticamente valiosos?, ¿podemos construir modelos computacionales de las preferencias estéticas de la gente que nos permitan simular y automatizar su juicio?

Si cruzamos estos dos pares de dimensiones –objeto vs. sujeto y descripción vs. generación–, podemos identificar cuatro aplicaciones diferentes del aprendizaje automático y la IA en la estética:

Reconocimiento de patrones

(análisis y descripción)

Generación de patrones

(producción y predicción)

Objetos

Estudiar objetos

Generar objetos

Sujetos

Estudiar a los sujetos

Generar sujetos

Para ilustrar los distintos campos de este mapa, consideremos la obra de Johann Sebastian Bach. De su música se ha dicho que es altamente estructurada y matemática, el «ajedrez de la música» por así decirlo, y ha sido objeto tanto de descripción como de generación algorítmicas (como el proyecto «DeepBach» de 2016):

1) «Estudiar objetos»: a partir de un conjunto de datos que contiene todas las composiciones de Bach, la IA analiza patrones melódicos, rastreando semejanzas entre diferentes partituras y extrayendo el estilo característico del compositor.

2) «Generar objetos»: después de haber sido entrenada con el conjunto de datos de composiciones de Bach, se utiliza la IA para generar nuevas variantes que suenen a Bach.

Sin embargo, si en cualquiera de estas tareas (análisis de las características formales de una composición musical y producción de variantes) no se tuviera en cuenta el modo en que las personas reaccionan a y experimentan la música, se perdería un aspecto esencial del análisis estético. Aquí es donde entra en juego la cuestión de la respuesta de los sujetos:

3) «Estudiar a los sujetos»: se recogen y analizan preferencias para determinar qué características musicales se prefieren especialmente o qué cualidades musicales determinan una reacción estética concreta (un sentimiento, un estado de ánimo, etc.). Piensa en cómo las plataformas de música online rastrean mediante algoritmos las preferencias de los usuarios. Si la diferencia entre las preferencias individuales no es demasiado grande, es posible construir un modelo de evaluación estética en el ámbito de las composiciones de Bach. El modelo genera predicciones de cómo evaluaría un usuario los nuevos corales de Bach. A su vez, los oyentes escuchan estas nuevas composiciones y retroalimentan al modelo. Si la diferencia entre las reacciones de los usuarios es demasiado grande, podemos utilizar el análisis cluster o de conglomerados para identificar distintos tipos de preferencias y generar modelos diferentes que se adapten a cada tipo. Este planteamiento no sería distinto del de las empresas que «segmentan» a los clientes de su mercado en grupos más pequeños en función de datos demográficos, intereses, necesidades, comportamientos y/o ubicación. De hecho, describir y predecir los comportamientos estéticos de las personas en función de sus elecciones de escucha previas conforman la evolución y el perfeccionamiento del análisis tradicional de las preferencias de los consumidores como práctica de investigación sociológica y de marketing. Sin embargo, los enfoques contemporáneos utilizan los datos de un modo que ofrece nuevas posibilidades analíticas. Mientras que los estudios sociológicos y de mercado tradicionales suelen recopilar datos, utilizar promedios estadísticos agregados y formar grupos basados en modelos sociológicos teóricos de tipos humanos, el rastreo y el análisis algorítmicos de datos son capaces de generar perfiles personales que utilizan como datos comportamientos individuales, como hacer clic o dar «me gusta» a determinadas imágenes en una red social, o escuchar una música concreta en Spotify o YouTube. En lugar de agrupar datos de muchos sujetos, cada perfil es único para un solo individuo.

4) «Generar sujetos»: los sistemas de recomendación de las plataformas online utilizan modelos que predicen lo que podría gustar a un usuario. Sin embargo, al modelar el juicio estético de una persona, también es posible generar comportamiento y juicio. Modelar las preferencias y respuestas estéticas de los oyentes nos permite, en principio, simular cómo se comportarían y reaccionarían las personas ante objetos concretos. Si un compositor (o la propia IA) creara una nueva variante de música al estilo de Bach, un sistema artificial entrenado según el modelo estético de un sujeto podría formular valoraciones por sí mismo sin necesidad de remitir a un sujeto humano.

No es difícil imaginar que los sistemas de «juicio artificial» puedan utilizarse cada vez más en el futuro. Dichos sistemas evaluarían de forma autónoma objetos culturales, puntuando con mayor o menor valor estético una pieza de diseño, un artículo de moda o una imagen. Un juez artificial podría hacer algo más que decirnos «También podría gustarte» (como en los sistemas de recomendación tradicionales). Podría decirnos «cuánto apreciaría la gente» un artefacto estético concreto que ha sido sometido a este sistema, cómo lo juzgaría la gente, incluso predecir lo que nos diría sobre él.

Los sistemas automatizados para predecir la puntuación estética de una imagen son un ejemplo típico de juicio artificial. Funcionan utilizando una combinación de métricas objetivas (calidad de la imagen, nitidez, contraste óptimo, colores, etc.) y valoraciones subjetivas. Para crear un sistema de este tipo, un gran número de personas evalúan muchas imágenes. A continuación, estos datos se utilizan para entrenar una red neuronal que, posteriormente, puede calificar nuevas imágenes de forma automática[9]. Además, podemos añadir que estos algoritmos podrían ser capaces de identificar propiedades estéticas (en lo tocante a los objetos) y preferencias individuales (en lo tocante a los sujetos) de las que las personas ni siquiera son conscientes, pero que se manifiestan en su comportamiento valorativo.

Patrones de explicación, o de qué hablamos cuando hablamos de estética

El análisis computacional puede permitirnos extraer patrones y estructuras formales, pero no comprender cómo esos patrones afectan a la percepción, la emoción y la cognición humanas. Los patrones considerados al margen del significado humano están, en última instancia, vacíos. El historiador del arte Michael Baxandall (en su libro Patterns of Intention [Modelos de intención], de 1985) describió de forma convincente la esencia del lenguaje crítico que utilizamos al hablar de cualquier obra de arte o producto cultural. Para Baxandall, el discurso que creamos no es ni una mera descripción factual de unas características, ni un informe subjetivo de las reacciones de una persona, sino que consiste en poner de relieve la relación entre el objeto y las respuestas humanas (el significado que aportan y la reacción estética que manifiestan). Esta relación está además mediada por una comprensión de los significados simbólicos y culturales del objeto. Un crítico, por así decirlo, indica al lector qué tipo de reacción se espera (o se habría esperado de la gente en el pasado) ante un objeto concreto. Expresado en los términos del mapa del epígrafe anterior, significaría establecer una conexión entre la descripción del objeto y la descripción de las correspondientes reacciones subjetivas.

Siguiendo a Baxandall, en el arte, las explicaciones culturales y críticas no son simples descripciones o clasificaciones: son «principalmente una representación de nuestros pensamientos sobre él [el objeto contemplado]» (Patterns of intention, p. 10). Lo que describimos es una «descripción parcialmente interpretativa»: «no se describen imágenes, sino nuestros pensamientos de haber visto imágenes» o, al menos, hipótesis sobre esos pensamientos. La eficacia de la argumentación de un crítico reside en su capacidad para persuadir de forma convincente al lector de que el artefacto suscita el tipo de reac­ciones y pensamientos que el crítico pretende explicitar. Además, el uso que hace de las palabras y los conceptos, al tiempo que afina la percepción de un objeto, profundiza en el significado del propio concepto: «conceptos y objeto se perfeccionan mutuamente» (Patterns of intention, p. 34). Por ejemplo, si describimos El grito de Edvard Munch (1893) como una obra que inspira un sentimiento de pavor, el propio concepto de pavor como noción estética se enriquecerá al utilizar el célebre cuadro de Munch como ejemplo.

Los artefactos de los medios sintéticos (imágenes, canciones, textos) son generados por redes que han sido entrenadas en grandes conjuntos de datos de artefactos preexistentes similares, como se ve en el siguiente diagrama:

Sin embargo, si se espera que el contenido generado tenga valor estético, las redes generativas deben tener en cuenta no sólo la dimensión formal (cómo se hacen los artefactos), sino también sus correspondientes interpretación y reacción subjetivas, incluidas las preferencias estéticas de las personas. De lo contrario, seríamos capaces de generar infinitas variaciones de patrones, pero no tendríamos ni idea de cómo se relacionan con nuestra apreciación. Si, como hemos dicho, la descripción de patrones sin significado es algo vacío, la generación de patrones sin interpretación humana es algo ciego.

En la actual generación de medios de la IA, los humanos manejan redes generativas seleccionando, ajustando y retocando el proceso para obtener el resultado deseado. Este resultado también depende de que los humanos sigan su propia sensibilidad estética: por ejemplo, un experto en música tuvo que evaluar y filtrar las diferentes versiones generadas de la Sinfonía inacabada de Schubert. Sólo un análisis algorítmico de respuestas subjetivas («Estudiar a los sujetos») permitiría una automatización progresiva de este paso valorativo.

Además, «Estudiar a los sujetos» implicaría tanto reacciones individuales como colectivas. Esto último supone analizar respuestas a objetos culturales históricamente sedimentadas. Desde un punto de vista ideal, una IA capaz de crear arte y diseño portadores de significado tendría en cuenta la historia de lo que ya existe, no sólo para extrapolar patrones a partir de los artefactos, sino también para interpretar su recepción colectiva, es decir, cómo ha reaccionado la gente ante estos artefactos a lo largo del tiempo. Así pues, utilizar una IA para generar nuevos artefactos culturales (y ayudar a los creadores humanos) requerirá utilizar una IA para el análisis cultural. Para ello sería necesario poner en contacto la estética artificial con las diversas disciplinas que se ocupan de este asunto: estética filosófica, historia del arte, psicología del arte, antropología y sociología de la cultura, etc. Es cierto que los nuevos avances técnicos pueden generar tipos de artefactos totalmente nuevos que no tienen por qué parecerse a la producción cultural del pasado. Sin embargo, si queremos entender mejor cómo estos artefactos pueden afectar a las personas, comprender cómo reaccionamos y dotamos habitualmente de significado a los objetos estéticos podría salvarnos de andar a ciegas. Puede que el futuro próximo nos depare artefactos estéticos completamente nuevos, pero es poco probable que nos depare una naturaleza humana completamente nueva.

Computación y psicología

Los fenómenos estéticos conllevan una compleja relación entre todas las facultades humanas, desde los mecanismos perceptuales de nivel bajo hasta los procesos afectivos y cognitivos de nivel alto. No en vano, a finales del siglo xix, Gustav Fechner, padre de la psicología experimental, ya había identificado la estética como el reto crucial para sus nuevos métodos en el campo de la psicología científica[10]. De hecho, investigar cómo reaccionan y se comportan las personas en el transcurso de una experiencia estética (el ámbito que definimos como «Estudiar a las personas») ha sido durante mucho tiempo una tradición de la llamada estética psicológica experimental o empírica. Fechner investigó, por ejemplo, si la gente prefiere las formas que responden a la proporción áurea. Aunque los resultados obtenidos por Fechner parecen confirmar la regla, estudios posteriores no consiguieron replicar los mismos resultados. Esta línea de investigación se mantuvo constante durante casi un siglo: por ejemplo, AestheticMeasure[11](La medida estética) de Birkhoff intentó plasmar en una fórmula cuantificable la relación estética óptima entre orden y complejidad de una figura, de su forma: un orden alto con una complejidad elevada correspondería, según él, a un mayor placer estético. En la década de 1970, la nueva estética experimental de Daniel Berlyne[12] introdujo los factores motivacionales como componente clave del placer y la apreciación estéticos: el valor estético no es sólo una función de las características de un objeto, sino también del tono hedónico de un sujeto, es decir, de su nivel de interés y estimulación. Su relación en forma de U invertida entre complejidad y disfrute sugiere un punto medio óptimo entre muy poca y demasiada complejidad en un estímulo. Esto también ha sido objeto de investigación empírica, aunque con resultados dispares. A principios del nuevo siglo, los investigadores consideraron necesario pasar de los asépticos experimentos psicofísicos basados en patrones abstractos simples a la observación de cómo reaccionan las personas ante obras de arte, artefactos u organismos naturales[13]. Recientemente, se han popularizado en este campo los enfoques neuropsicológicos, ampliando su foco a cuestiones como la creatividad y los mecanismos de recepción e interpretación en formas artísticas concretas (artes visuales, música, cine, literatura).

Un investigador de este campo suele llevar a cabo experimentos con grupos reducidos de personas en condiciones cuidadosamente controladas, utilizando técnicas estadísticas para analizar los datos recopilados. Por ejemplo, en muchos experimentos de estética visual, se muestra a un grupo un conjunto particular de imágenes (el conjunto de datos puede ser preexistente o haberse creado específicamente para el experimento) y se pide a las personas que expresen sus preferencias de alguna manera, p. e., puntuando cada imagen según una escala numérica. Son muchos los resultados tras décadas de investigación en estética experimental. Por ejemplo, los psicólogos demostraron que una exposición más prolongada a un estímulo acaba generando una familiaridad cada vez mayor con el objeto, lo que induce a preferirlo tanto a él como a prototipos dentro de la categoría de dicho objeto. Es decir, nos gusta lo que es más típico, y esa soltura general, la facilidad para procesar una experiencia, guarda relación con la preferencia estética. Además, los resultados de las investigaciones mostraron una preferencia por la simetría en los rasgos faciales, por las formas suaves y curvas frente a las angulosas; unas preferencias concretas por los paisajes naturales frente a los escenarios artificiales, así como por los escenarios arquitectónicos de estética naturalista[14]. Numerosos estudios han puesto a prueba las reglas clásicas de la armonía, el equilibrio y la «buena composición», como la «regla de los tercios» o los principios descritos por la teoría de la Gestalt (que Rudolf Arnheim aplicó por primera vez al arte en su clásico Art and Visual Perception [Arte y percepción visual], de 1954).

Hay que tener en cuenta que estos experimentos suelen recurrir a estudiantes universitarios. Su juicio estético podría reflejar un gusto específico, no representativo de los de artistas, diseñadores o críticos. Diversos estudios han confirmado reiteradamente una diferencia significativa entre expertos y no expertos en la evaluación estética. Hay que señalar, además, que la mayoría de las investigaciones no apuntan a resultados concluyentes, sino que muestran que la preferencia estética depende de numerosas variables, como el contexto y las actitudes subjetivas. Un ejemplo de estos factores contextuales sería la descripción verbal de una obra de arte: los títulos cambian nuestra apreciación de las pinturas y nuestra forma de verlas[15]. El orden de presentación (¿qué objeto vemos primero?, ¿cuál después?), la disposición espacial (¿qué objeto está a la izquierda?, ¿cuál a la derecha?) y la yuxtaposición (¿comparamos objetos similares o muy diferentes?) también afectan al modo en que las personas juzgamos los objetos[16]. Asimismo, el entorno influye en cómo evaluamos y apreciamos el arte.

Por ejemplo, nuestra recepción de una obra puede diferir según la observemos en el típico «cubo blanco» o en un contexto más informal. Existen variaciones en función de las características del observador: factores como el estado emocional y el nivel de excitación de una persona, su experiencia y conocimiento, los rasgos de su personalidad y su cultura contribuyen a la experiencia y el juicio estéticos. En lugar de buscar unas reglas genéricas universales –como la proporción áurea, la «unidad en la multiplicidad» y el modelo en U invertida de Berlyne–, la investigación experimental estudia mecanismos muy sutiles teniendo en cuenta factores contextuales, personales y culturalmente específicos. En resumen, este campo ha generado y puesto a prueba muchas teorías interesantes para explicar las experiencias estéticas humanas, demostrando al mismo tiempo que ninguna de ellas parece tener validez universal[17].

Hay dos diferencias cruciales entre los actuales métodos computacionales y la estética experimental tradicional. En primer lugar, la estética experimental se centra sobre todo en los sujetos, mientras que la artificial lo hace en los objetos. Además, la estética experimental utiliza estímulos especialmente seleccionados y muy controlados, mientras que la estética artificial utiliza «big data» obtenidos a partir de comportamientos humanos reales, que a menudo se recopilan a través de plataformas digitales.

Mientras que la estética experimental suele producir estímulos en entornos controlados y observar las respuestas de la gente, los métodos computacionales hacen uso de grandes conjuntos de datos que recogen las preferencias manifestadas por los usuarios, como Photo.net o Dpchallenge.com (utilizados para estudios computacionales a finales de la década de 2000), lo que permite a los investigadores explorar cómo da la gente sus «me gusta» en las redes sociales. En otros casos, captan y miden el comportamiento real de los consumidores en plataformas on line, como los servicios de streaming de música y cine, con el objetivo de inferir unas características a partir de los productos más populares.

En la estética experimental, un enfoque centrado en el sujeto hace hincapié en el análisis de las denominadas «variables dependientes», que incluyen las respuestas controladas de los sujetos, medidas mediante valoraciones hechas conforme a escalas bien calibradas, así como las reacciones fisiológicas (frecuencia cardiaca, conductancia de la piel, dilatación de las pupilas, etc.) y la actividad cerebral, medidas mediante encefalogramas (EEG) o imagen por resonancia magnética funcional (IRMf), que en teoría evitan los problemas asociados a la evaluación verbal. Por otro lado, el análisis computacional del comportamiento estético es un enfoque centrado en el objeto y resulta especialmente eficaz a la hora de describir «variables independientes», es decir, los contenidos estéticos que consumen y juzgan las personas a diario. Esta fortaleza reside en su capacidad para recopilar y analizar un gran número de características a partir de imágenes, música y otros artefactos culturales. Como ya se ha dicho, la ventaja clave de los enfoques computacionales aplicados a la estética es que no se ven limitados por la búsqueda de unos universales estéticos ni por considerar que las respuestas habituales de grupos (relativamente pequeños) de sujetos sean representativas de unas actitudes generales. En su lugar, los algoritmos pueden rastrear preferencias y comportamientos individuales sin necesidad de modelizar unas respuestas estéticas basadas en promedios agregados. El bigdata no nos obliga a presuponer la existencia de un sujeto estético humano universal.

A pesar de estas ventajas, una estética artificial que se centre en las preferencias estéticas sigue teniendo que enfrentarse a los retos metodológicos que caracterizan a todos los enfoques experimentales. Mencionaremos brevemente dos de ellos, relativos a 1) la dificultad de aislar las características vinculadas a nuestra evaluación estética y 2) la dificultad de determinar qué tipo de respuesta estamos tratando de describir.

En lo tocante al primer punto, las características de los objetos estéticos son difíciles de aislar. Por ejemplo, para estudiar cómo influyen en la apreciación estética las variaciones en la forma de un objeto, un experimento debe utilizar un entorno controlado que analice el efecto de modificaciones mínimas en dicha forma y no mezcle múltiples variaciones a la vez (p. e., cambios de forma y color, o de forma y textura, etc.). Sin embargo, las variables estéticas también pueden interactuar entre sí. Por consiguiente, este montaje no nos permitiría establecer una correspondencia unívoca entre una característica y las respuestas estéticas a esa característica en ese objeto concreto. No cabe duda de que es posible determinar tendencias generales en las preferencias de la gente: por ejemplo, podríamos observar que un estilo musical es más popular que otro en un grupo demográfico concreto en un país determinado. Sin embargo, no siempre es fácil alcanzar una mayor granularidad y aprehender el papel preciso de cada factor en el efecto estético final: ¿qué es exactamente lo que hace que un estilo musical sea más atractivo que otro? Para alcanzar este nivel de comprensión, necesitaríamos un gran número de artefactos estéticos similares que presenten sólo pequeñas variaciones entre sí.

En algunos casos, las plataformas digitales nos permiten estudiar el inmenso número de estímulos diferentes pero no demasiado heterogéneos que la web pone a nuestra disposición. Por ejemplo, en un estudio de 2014[18], los autores utilizaron cientos de características de microvídeos (de hasta seis segundos de duración) en Vine, una antigua plataforma para compartir formatos multimedia, con objeto de predecir si la gente los juzgaría «creativos» o «no creativos». El estudio utilizó una plataforma de crowdsourcing en la que 284 personas valoraron 3.800 vídeos. Cada vídeo fue evaluado por varias personas, con un promedio de concordancia de 84%. Las características iban del contenido de la escena, las técnicas cinematográficas o las técnicas fotográficas a la composición, el efecto visual, el efecto sonoro y la novedad. Todas se definieron matemáticamente y se calcularon de forma automática a partir de los vídeos mediante un análisis de sus fotogramas y su banda sonora. Los autores precisan el porcentaje alcanzado por cada grupo de características, y concluyen: «Los mejores resultados se obtienen cuando combinamos características innovadoras con otras de valor estético, lo que pone de manifiesto la utilidad de esta definición dúplice de creatividad». Por separado, composición y técnicas fotográficas superan al contenido (77% vs. 73%), mientras que las innovaciones de vídeo están por encima de las sonoras (74% vs. 63%). Para obtener este tipo de resultados, es necesario disponer de un conjunto de datos suficientemente amplio cuyas características sean manejables (como una película corta de seis segundos), algo que no siempre ocurre con la producción cultural humana.

En cuanto al segundo punto, las respuestas estéticas humanas (es decir, las variables dependientes en un experimento psicológico) también plantean sus propios retos. ¿Qué medimos cuando preguntamos a un sujeto por su experiencia estética? Nuestras relaciones con los objetos estéticos tienen muchas capas y dimensiones. Pueden ir desde reacciones fisiológicas subpersonales hasta complejas formulaciones críticas, desde un «me gusta» dado a una imagen en una red social hasta un juicio crítico elaborado, pasando por hábitos de consumo reales. La respuesta será diferente según preguntemos si le «gusta» una película o si la considera una obra maestra, o si simplemente observamos sus reacciones fisiológicas mientras está viendo esa película. Más aún, debemos distinguir entre juicio de valor y mera preferencia/deseo subjetivos: en general, podemos decir que los juicios de valor son más estables que el deseo o las preferencias momentáneas que sentimos por un determinado objeto. Puedo considerar que la canción X es una obra maestra (y mejor que la canción Y), pero no tener ganas de escucharla en ese momento y, sin embargo, sí muchas de escuchar Y, tal vez debido a mi estado emocional o porque he escuchado X demasiadas veces.

Esto significa que mis hábitos de consumo pueden revelar unas preferencias que no expresan necesariamente mi idea general de valor estético: puedo ser un ávido consumidor de películas de acción y, sin embargo, considerar estéticamente superiores las de arte y ensayo, aun cuando las vea más de vez en cuando. Los sistemas artificiales que recopilan datos sobre el consumo estético humano deben tener en cuenta estas cuestiones si queremos evitar modelos demasiado simplistas de la experiencia y el juicio estéticos humanos, ambos utilizados en algoritmos valorativos y generativos artificiales.

[1] Datta et al. proponen 56 características y reglas diferentes. R. Datta, D. Joshi y J. Li (2006), «Studying aesthetics in photographic images using a computational approach», en A. Leonardis, H. Bischof y A. Pinz (eds.), Computer Vision – ECCV 2006. 9th European Conference on Computer Vision, Berlín/Heidelberg, Springer, 2006, pp. 288-301.

[2] Y. Kao, R. He y K. Huang, «Deep aesthetic quality assessment with semantic information», IEEE Transactions on Image Processing 26, 3 (2017), pp. 1482-1495. Doi: [https://doi.org/10.1109/TIP.2017.2651399].

[3] G. Hadjeres, F. Pachet y F. Nielsen, «DeepBach: A steerable model for Bach chorales generation», Proceedings of Machine Learning Research 70, arXiv (2017) [https://arxiv.org/abs/1612.01010]; Emerging Technology from the arXiv, «Deep-learning machine listens to Bach, then writes its own music in the same style», MIT Technology Review, 14 de diciembre de 2016 [https://www.technologyreview.com/2016/12/14/155416].

[4] TwoSetViolin, «Can You Tell the Difference between AI and Human Composers?» (vídeo), 23 de septiembre de 2020, YouTube [https://youtu.be/PmL31mVx0XA]; «Bach vs AI: spot the difference», Orchestra of the Age of Enlightenment (22 de noviembre de 2019); «Bach vs AI: Spot the difference» (vídeo), YouTube [https://youtu.be/lv9W7qrYhbk].

[5] E. Davis, «Schubert’s “Unfinished” Symphony completed by artificial intelligence», Classic FM, 6 de febrero de 2019 [https://www.classicfm.com/composers/schubert/unfinished-symphony-completed-by-ai].

[6] A. Xue, «End-to-end Chinese landscape painting creation using generative adversarial networks», Proceedings of IEEE WACV, 2011, 3863-3871, arXiv [https://arxiv.org/abs/2011.05552].

[7] Al recurrir a problemas bien y mal definidos, estamos aludiendo a la crucial distinción que hizo Herbert Simon en 1973 en lo tocante a la inteligencia artificial. H. A. Simon, «The structure of ill structured problems», Artificial Intelligence 4 (1973), pp. 181-201. Doi: [https://doi.org/10.1016/0004-3702(73)90011-8].

[8] Entre las aplicaciones prácticas de este análisis figura el diseño de interfaces online interactivas para colecciones museísticas. Por ejemplo, cuando una persona elige una obra concreta, el sistema le muestra otras similares de la colección. También se puede utilizar en una historia digital del arte: los cambios en cualquier característica o en una combinación de características pueden trazarse a lo largo del tiempo para analizar la evolución de un solo artista o de periodos históricos enteros.

[9] D. Djudjic, «The rise of the machines: Google’s AI will decide if your photos are aesthetically pleasing», DIY Photography, 26 de diciembre de 2017 [https://www.diyphotography.net/rise-machines-googles-ai-will-decide-photos-aesthetically-pleasing]; A. Mikhailiuk, «Deep image quality assessment», Towards Data Science, 15 de marzo de 2021 [https://towardsdatascience.com/deep-image-quality-assessment-30ad71641fac].

[10] G. T. Fechner, Vorschule der Aesthetik, Wiesbaden, Breitkopf und Härtel, 1876.

[11] G. D. Birkhoff, Aesthetic measure, Cambridge, Mass., Harvard University Press, 1933.

[12] D. E. Berlyne, Studies in the new experimental aesthetics, Oxford, Wiley, 1974.

[13] H. Leder, B. Belke, A. Oeberst y D. Augustin, «A model of aesthetic appreciation and aesthetic judgements», British Journal of Psychology 95, 4 (2004), pp. 489-508.

[14] Para una visión de conjunto, véanse P. L. Locher, «Contemporary experimental aesthetics: Procedures and findings», en V. A. Ginsburgh y D. Throsby (eds.), Handbook of the Economics of Art and Culture, vol. 2, Amsterdam, North Holland, 2013; P. P. L. Tinio y J. K. Smith (eds.), The Cambridge handbook of the psychology of aesthetics and the arts, Cambridge, Cambridge University Press, 2014.

[15] H. Leder, C. C. Carbon y A. L. Ripsas, «Entitling art: Influence of title information on understanding and appreciation of paintings», Acta Psychologica 121, 2 (2006), pp. 176-198.

[16] M. W. Khaw y D. Freeberg, «Continuous aesthetic judgment of image sequences», Acta Psychologica 188 (2018), pp. 213-219.

[17] Incluso se ha puesto en tela de juicio la premisa de que los espectadores asociarían universalmente determinadas formas con cualidades específicas o «efectos estéticos». E. Specker, M. Forster, H. Brinkmann, L. Boddy, R. Rosenberg, H. Leder et al., «Warm, lively, rough? Assessing agreement on aesthetic effects of artworks», PLOS ONE (2020). Doi: [https://doi.org/10.1371/journal.pone.0232083].

[18] M. Redi, N. O’Hare, R. Schifanella, M. Trevisiol y A. Jaimes, «6 seconds of sound and vision: Creativity in micro-videos», IEEE Conference on Computer Vision and Pattern Recognition, 2014, 4272-4279. Doi: [https://doi.org/10.1109/CVPR.2014.544].