Ir al contenido principal

INTELIGENCIA ARTIFICIAL Y LA CREATIVIDAD EN LA COMPOSICIÓN DE LA MÚSICA

     La Música es una de las inteligencias de Gardner en su teoría de las inteligencias múltiples. La forma en que los humanos perciben y entienden la música aún se esta estudiando y es crucial para desarrollar modelos de inteligencia artificial que imiten tales procesos. La generación de música con Inteligencia Artificial es un campo emergente que ésta ganando mucha atención en los últimos años. A continuación, describimos cómo los humanos componen música y cómo los nuevos sistemas de inteligencia artificial podrían imitar dicho proceso al comparar los avances pasados y recientes en el campo con las técnicas de composición musical. 

     Para comprender y comparar los sistemas de generación de música, es necesario comprender cómo los humanos perciben, entienden y componen la música. La comprensión humana y la percepción de la música depende de una variedad de factores. El trasfondo cultural, el conocimiento musical y la creatividad del compositor son algunas de las principales piezas que caracterizan el flujo de trabajo de la composición musical humana. Una forma de componer es desarrollar una idea inicial que tiene el compositor. Esta idea contiene no solo principios musicales simbólicos o relacionados con la partitura, sino también atributos de interpretación como el timbre o la dinámica, especialmente si el compositor es un músico experimentado.

     El proceso de generación de música basada en IA depende de factores distintos a los mencionados anteriormente, y hay que tener en cuenta los sesgos que pueden aparecer en cada uno de los agentes del flujo de trabajo de composición basada en IA. Hay similitudes entre los procesos de composición humanos y de la IA que discutiremos en este articulo, sin embargo, existe una gran brecha entre los humanos y las máquinas cuando se trata de la comprensión y percepción de la música.

HUMANOS VS IA-BASED MUSIC GENERATION

     Comprender el cerebro humano es importante para desarrollar herramientas de IA que puedan imitar el proceso cognitivo. El campo que tiene como objetivo estudiar dichos procesos para alimentar y mejorar los modelos de IA se llama NeuroAI. Una mejor comprensión del cerebro humano podría ayudar a construir herramientas creativas de inteligencia artificial que podrían extrapolar y ser creativas como lo  son los humanos.

A. El concepto de ¨creatividad¨

     Amabile, define creatividad como ¨proceso que da como resultado un trabajo novedoso que es aceptado como defendible, útil o satisfactorio por un grupo en algún momento¨. Esta definición se basa en el producto final, no en el proceso o la identidad que produce tal creatividad. También significa que la nueva música puede considerarse un proceso creativo si es aceptada por un grupo de personas, es decir, aceptada por una parte de nuestra sociedad. A partir de estas definiciones podemos argumentar que la música basada en IA podría considerarse creativa si la sociedad la acepta y la encuentra útil para cualquier propósito. Cuando se trata del arte hecho por máquinas, también podemos definir el concepto de creatividad computacional que es definida por Colton y Wiggings, como ¨la ciencia, la ingeniería y la filosofía de los sistemas computacionales que, al asumir responsabilidades particulares, exhiben comportamientos que los observadores imparciales considerarían creativos¨ Este campo se llama Meta creación Musical (MuMe).

Fig. 1: Un esquema general de las relaciones entre los agentes en el flujo de trabajo de composición basado en IA. En la figura se muestran los diferentes apartados de este trabajo en los que se aborda cada uno de los elementos presentados.


B. Medición de la creatividad

     Los investigadores han intentando medir la creatividad con tres (3) técnicas diferentes: haciendo un análisis objetivo o subjetivo y usando pruebas de creatividad. En el campo de la generación o composición musical basada en IA, la técnica más utilizada para medir la calidad de una composición generada es el test de Turing o una encuesta con preguntas un tanto cercanas a los test de creatividad.

     En el campo de investigación de la IA que tiene como objetivo generar nueva música, generalmente los resultados se miden con pruebas subjetivas, lo que no siempre es confiables porque los resultados dependen de la cultura y los antecedentes de la población. 

     Para tratar de encontrar las partes del cerebro donde se encuentra esta creatividad y cómo se puede representar la música como un lenguaje similar al lenguaje escrito, describiremos ahora las relaciones entre los lenguajes escrito y musical.

C. La música como forma de lenguaje

     Sloboda afirma que ¨el lenguaje musical puede entenderse, a nivel estructural, como cualquier otro lenguaje¨. La música evoca emociones a través de elementos musicales como la armonía, el ritmo o el timbre. Si consideramos que una nota o una propiedad de una nota es un carácter o una palabra, y extendemos esta relación a otros elementos musicales, podríamos codificar la música como texto y aplicar técnicas de procesamiento de lenguaje natural (NLP) a la música. Al establecer una relación entre las dos estructuras, podríamos aplicar modelos existentes  en la generación de lenguaje a la generación de música.

     El área del cerebro responsable de la comprensión e interpretación del lenguaje es el área de Wernicke (o área posterior de habla), que se encuentran en el hemisferio izquierdo. Se ha demostrado que el cerebro participan espontáneamente en la predicción de la siguiente palabra antes de que ocurra sin necesidad de instrucción explicita. Esto es precisamente lo que hacen los modelos autorregresivos de lenguaje profundo (DLM), lo que sugiere que las predicciones de la siguiente palabra de DLM y humanos son similares en contextos naturales.

    Así, viendo la música como una forma de lenguaje y descartando atributos de interpretación como el timbre, podemos argumentar que las partes del cerebro encargadas de comprender y saber interpretar la estructura de un texto y una pieza musical son las mismas. Sin embargo, las matemáticas y la teoria de la probabilidad en la que se basan los modelos de IA son diferentes de la forma en que funciona y procesa la información el cerebro humano.

D. Composición humana y procesos de generación de música basados en IA

     El proceso de composición humana implica procesos cognitivos, como la atención, la generación de respuestas, la planificación y el control de la acción, y la inhibición de las respuestas repetitivas. LeCun descubre una arquitectura de sistema para inteligencia autónoma o modelo de palabra. El uso de redes neuronales para modelar estos sistemas complejos se introdujo en la década de 1980 en trabajos de Jordan et al., Widrow et al, etc. Este modelo mundial tiene los siguientes módulos: el módulo de configuración que toma entradas, el módulo de percepción que estima el estado actual del mundo, el módulo de modelo mundial que predice posibles estados futuros del mundo, el módulo de costo que calcula la salida o ¨energía¨, el módulo de memoria de término que recuerda los estados mundiales actuales y previstos y el módulo de actor que calcula propuestas para secuencias de acción. Si bien este es un modelo teórico de ¨mundo¨, se podría construir una máquina musical general que sería capaz de comprender diferentes representaciones musicales (audio o partituras), analizarlas, crear música nueva e interactuar con la música creada.


Fig. 2: Comparación entre la IA y los procesos de composición humanos. A la derecha, el compositor humano hace música con los conocimientos previos que tiene, y también con la creatividad que le lleva a ideas musicales que pueden ser ritmos, notas, etc, o sus combinaciones en motivos o melodías. A la izquierda, el compositor de IA hace música con modelos entrenados en diferentes tareas MIR (el ¨conocimiento previo¨) combinado con un modelo que compone música condicionada. Los modelos preentrenados que representa la música, y la memoria podría ser comparable a una gran RNN.  A continuación, vemos la pieza musical (o el ¨mundo¨ si consideramos toda la música existente) que es creada o completada por el humano o el compositor de IA, que es creado o completado por el ser humano, en el caso de este último con técnicas de Reinforcement Learning, modelos de secuencia, etc.

Para obtener la información completa del articulo 2210.13944.pdf (arxiv.org) 

Comentarios