La Música es una de las inteligencias de Gardner en su teoría de las inteligencias múltiples. La forma en que los humanos perciben y entienden la música aún se esta estudiando y es crucial para desarrollar modelos de inteligencia artificial que imiten tales procesos. La generación de música con Inteligencia Artificial es un campo emergente que ésta ganando mucha atención en los últimos años. A continuación, describimos cómo los humanos componen música y cómo los nuevos sistemas de inteligencia artificial podrían imitar dicho proceso al comparar los avances pasados y recientes en el campo con las técnicas de composición musical.
Para comprender y comparar los sistemas de generación de música, es necesario comprender cómo los humanos perciben, entienden y componen la música. La comprensión humana y la percepción de la música depende de una variedad de factores. El trasfondo cultural, el conocimiento musical y la creatividad del compositor son algunas de las principales piezas que caracterizan el flujo de trabajo de la composición musical humana. Una forma de componer es desarrollar una idea inicial que tiene el compositor. Esta idea contiene no solo principios musicales simbólicos o relacionados con la partitura, sino también atributos de interpretación como el timbre o la dinámica, especialmente si el compositor es un músico experimentado.
El proceso de generación de música basada en IA depende de factores distintos a los mencionados anteriormente, y hay que tener en cuenta los sesgos que pueden aparecer en cada uno de los agentes del flujo de trabajo de composición basada en IA. Hay similitudes entre los procesos de composición humanos y de la IA que discutiremos en este articulo, sin embargo, existe una gran brecha entre los humanos y las máquinas cuando se trata de la comprensión y percepción de la música.
HUMANOS VS IA-BASED MUSIC GENERATION
Comprender el cerebro humano es importante para desarrollar herramientas de IA que puedan imitar el proceso cognitivo. El campo que tiene como objetivo estudiar dichos procesos para alimentar y mejorar los modelos de IA se llama NeuroAI. Una mejor comprensión del cerebro humano podría ayudar a construir herramientas creativas de inteligencia artificial que podrían extrapolar y ser creativas como lo son los humanos.
A. El concepto de ¨creatividad¨
Amabile, define creatividad como ¨proceso que da como resultado un trabajo novedoso que es aceptado como defendible, útil o satisfactorio por un grupo en algún momento¨. Esta definición se basa en el producto final, no en el proceso o la identidad que produce tal creatividad. También significa que la nueva música puede considerarse un proceso creativo si es aceptada por un grupo de personas, es decir, aceptada por una parte de nuestra sociedad. A partir de estas definiciones podemos argumentar que la música basada en IA podría considerarse creativa si la sociedad la acepta y la encuentra útil para cualquier propósito. Cuando se trata del arte hecho por máquinas, también podemos definir el concepto de creatividad computacional que es definida por Colton y Wiggings, como ¨la ciencia, la ingeniería y la filosofía de los sistemas computacionales que, al asumir responsabilidades particulares, exhiben comportamientos que los observadores imparciales considerarían creativos¨ Este campo se llama Meta creación Musical (MuMe).
B. Medición de la creatividad
Los investigadores han intentando medir la creatividad con tres (3) técnicas diferentes: haciendo un análisis objetivo o subjetivo y usando pruebas de creatividad. En el campo de la generación o composición musical basada en IA, la técnica más utilizada para medir la calidad de una composición generada es el test de Turing o una encuesta con preguntas un tanto cercanas a los test de creatividad.
En el campo de investigación de la IA que tiene como objetivo generar nueva música, generalmente los resultados se miden con pruebas subjetivas, lo que no siempre es confiables porque los resultados dependen de la cultura y los antecedentes de la población.
Para tratar de encontrar las partes del cerebro donde se encuentra esta creatividad y cómo se puede representar la música como un lenguaje similar al lenguaje escrito, describiremos ahora las relaciones entre los lenguajes escrito y musical.
C. La música como forma de lenguaje
Sloboda afirma que ¨el lenguaje musical puede entenderse, a nivel estructural, como cualquier otro lenguaje¨. La música evoca emociones a través de elementos musicales como la armonía, el ritmo o el timbre. Si consideramos que una nota o una propiedad de una nota es un carácter o una palabra, y extendemos esta relación a otros elementos musicales, podríamos codificar la música como texto y aplicar técnicas de procesamiento de lenguaje natural (NLP) a la música. Al establecer una relación entre las dos estructuras, podríamos aplicar modelos existentes en la generación de lenguaje a la generación de música.
El área del cerebro responsable de la comprensión e interpretación del lenguaje es el área de Wernicke (o área posterior de habla), que se encuentran en el hemisferio izquierdo. Se ha demostrado que el cerebro participan espontáneamente en la predicción de la siguiente palabra antes de que ocurra sin necesidad de instrucción explicita. Esto es precisamente lo que hacen los modelos autorregresivos de lenguaje profundo (DLM), lo que sugiere que las predicciones de la siguiente palabra de DLM y humanos son similares en contextos naturales.
Así, viendo la música como una forma de lenguaje y descartando atributos de interpretación como el timbre, podemos argumentar que las partes del cerebro encargadas de comprender y saber interpretar la estructura de un texto y una pieza musical son las mismas. Sin embargo, las matemáticas y la teoria de la probabilidad en la que se basan los modelos de IA son diferentes de la forma en que funciona y procesa la información el cerebro humano.
D. Composición humana y procesos de generación de música basados en IA
El proceso de composición humana implica procesos cognitivos, como la atención, la generación de respuestas, la planificación y el control de la acción, y la inhibición de las respuestas repetitivas. LeCun descubre una arquitectura de sistema para inteligencia autónoma o modelo de palabra. El uso de redes neuronales para modelar estos sistemas complejos se introdujo en la década de 1980 en trabajos de Jordan et al., Widrow et al, etc. Este modelo mundial tiene los siguientes módulos: el módulo de configuración que toma entradas, el módulo de percepción que estima el estado actual del mundo, el módulo de modelo mundial que predice posibles estados futuros del mundo, el módulo de costo que calcula la salida o ¨energía¨, el módulo de memoria de término que recuerda los estados mundiales actuales y previstos y el módulo de actor que calcula propuestas para secuencias de acción. Si bien este es un modelo teórico de ¨mundo¨, se podría construir una máquina musical general que sería capaz de comprender diferentes representaciones musicales (audio o partituras), analizarlas, crear música nueva e interactuar con la música creada.


Comentarios
Publicar un comentario