Entradas etiquetadas como ‘aprendizaje automático’

¿Qué le falta a esta música generada por Inteligencia Artificial?

No, no es una adivinanza, ni una pregunta retórica. Realmente me pregunto qué es lo que le falta a la música generada por Inteligencia Artificial (IA) para igualar a la compuesta por humanos. Sé que ante esta cuestión es fácil desenvainar argumentos tecnoescépticos, una máquina no puede crear belleza, nunca igualará a la sensibilidad artística humana, etcétera, etcétera.

Pero en realidad todo esto no es cierto: las máquinas pintan, escriben, componen, y los algoritmos GAN (Generative Adversarial Network, o Red Antagónica Generativa) ya las están dotando de algo muy parecido a la imaginación. Además, y dado que las mismas máquinas también pueden analizar nuestros gustos y saber qué es lo que los humanos adoran, no tienen que dar palos de ciego como los editores o productores humanos: en breve serán capaces de escribir best sellers, componer hits y guionizar blockbusters.

El salto probablemente llegará cuando los consumidores de estos productos no sepamos (no “no notemos”, sino “no sepamos”) que esa canción, ese libro o esa película o serie en realidad han sido creados por un algoritmo y no por una persona. De hecho, la frontera es cada vez más difusa. Desde hace décadas la música y el cine emplean tanta tecnología digital que hoy serían inconcebibles sin ella. Y aunque siempre habrá humanos detrás de cualquier producción, la parcela de terreno que se cede a las máquinas es cada vez mayor.

Pero en concreto, en lo que se refiere a la música, algo aún falla cuando uno escucha esas obras creadas por IA. El último ejemplo viene de Relentless Doppelganger. Así se llama un streaming de música que funciona en YouTube 24 horas al día desde el pasado 24 de marzo (el vídeo, al pie de esta página), generando música technical death metal inspirada en el estilo de la banda canadiense Archspire, y en concreto en su último álbum Relentless Mutation (Doppelganger hace referencia a un “doble”).

Este inacabable streaming es obra de Dadabots, el nombre bajo el que se ocultan CJ Carr y Zack Zukowski, que han empleado un tipo de red neural llamado SampleRNN –originalmente concebida para convertir textos en voz– para generar hasta ahora diez álbumes de géneros metal y punk inspirados en materiales de grupos reales, incluyendo el diseño de las portadas y los títulos de los temas. Por ejemplo, uno de ellos, titulado Bot Prownies, está inspirado en Punk in Drublic, uno de los álbumes más míticos de la historia del punk, de los californianos NOFX.

Imagen de Dadabots.

Imagen de Dadabots.

Y, desde luego, cuando uno lo escucha, el sonido recuerda poderosamente a la banda original. En el estudio en el que Carr y Zukowski explicaban su sistema, publicado a finales del año pasado en la web de prepublicaciones arXiv, ambos autores explicaban que su propósito era inédito en la generación de música por IA: tratar de captar y reproducir las “distinciones estilísticas sutiles” propias de subgéneros muy concretos como el death metal, el math rock o el skate punk, que “pueden ser difíciles de describir para oyentes humanos no entrenados y están mal representadas por las transcripciones tradicionales de música”.

En otras palabras: cuando escuchamos death metal o skate punk, sabemos que estamos escuchando death metal o skate punk. Pero ¿qué hace que lo sean para nuestros oídos? El reto para los investigadores de Dadabots consistía en que la red neural aprendiera a discernir estos rasgos propios de dichos subgéneros y a aplicarlos para generar música. Carr y Zukowski descubrieron que tanto el carácter caótico y distorsionado como los ritmos rápidos de estos géneros se adaptan especialmente bien a las capacidades de la red neural, lo que no sucede para otros estilos musicales.

Y sin duda, en este sentido el resultado es impresionante (obviamente, para oídos que comprenden y disfrutan de este tipo de música; a otros les parecerá simple ruido como el de las bandas originales). Pero insisto, aparte del hecho anecdótico de que las letras son simples concatenaciones de sílabas sin sentido, ya que no se ha entrenado a la red en el lenguaje natural, la música de Dadabots deja la sensación de que aún hay un paso crucial que avanzar. ¿Cuál es?

No lo sé. Pero tengo una impresión personal. Carr y Zukowski cuentan en su estudio que la red neural crea a partir de lo ya creado, lo cual es fundamental en toda composición musical: “Dado lo que ha ocurrido previamente en una secuencia, ¿qué ocurrirá después?”, escriben Carr y Zukowski. “La música puede modelizarse como una secuencia de eventos a lo largo del tiempo. Así, la música puede generarse prediciendo ¿y entonces qué ocurre? una y otra vez”.

Pero esto ocurre solo un sampleado tras otro, mientras que un tema escrito por un compositor humano tiene un sentido general, un propósito que abarca toda la composición desde el primer segundo hasta el último. Toda canción de cualquier género tiene una tensión interna que va mucho más allá de, por ejemplo, la resolución de los acordes menores en acordes mayores. Es algo más, difícil de explicar; pero al escuchar cualquier tema uno percibe un propósito general de que la música se dirige hacia un lugar concreto. Y da la sensación de que esto aún le falta a la música automática, dado que la máquina solo se interesa por un “después” a corto plazo, y no por lo que habrá más allá. Se echa de menos algo así como una tensión creciente que conduzca hacia un destino final.

Sin embargo, creo que ya pueden quedar pocas dudas de que la música generada por IA terminará también superando estos obstáculos. Ya tenemos muchos ejemplos y muy variados de composiciones cien por cien digitales. Y si hasta ahora ninguna de ellas ha conseguido instalarse como un hit, ya sea entre el público mayoritario o entre los aficionados a estilos musicales más marginales, se da la circunstancia de que tampoco ninguna de ellas ha cruzado la barrera de lo etiquetado como “diferente” porque su autor no es de carne y hueso. Probablemente llegará el momento en que un tema se convierta en un éxito o en un clásico sin que el público sepa que el nombre que figura en sus créditos no es el de la persona que lo compuso, sino el de quien programó el sistema para crearla.