Y si te dijera que puedes crear música sin tocar un sólo instrumento

Tecnología, Aplicaciones, Inteligencia Artificial

Y si te dijera que puedes crear música sin tocar un sólo instrumento

Hace tiempo que se viene anunciando una transformación inminente en el mundo de la creación multimedia, abarcando desde imágenes y animaciones hasta audio y video. Nos encontramos al borde de una revolución impulsada por los avanzados algoritmos de Inteligencia Artificial, que emulan las complejas redes neuronales del cerebro humano. Herramientas que ya están redefiniendo radicalmente los procesos establecidos, marcando un cambio fundamental respecto a lo que conocíamos hasta ahora.

En este contexto, no solo la producción musical destaca por su interacción con la tecnología digital, sino que también la composición, la ejecución y la distribución han sufrido una transformación radical a lo largo de los últimos años. Actualmente, existe una gran cantidad de software y aplicaciones capaces de simular con una precisión asombrosa los sonidos de instrumentos acústicos. Esto ha democratizado en gran medida el acceso a la creación musical, permitiendo que músicos y productores de todos los niveles puedan experimentar y producir música sin la necesidad de tener acceso a una amplia variedad de instrumentos físicos o a estudios de grabación profesionales.

Pero estamos alcanzando cotas inimaginables hasta hace poco, a medida que la inteligencia artificial (IA) avanza, su impacto en nuestras vidas se vuelve más significativo, en la música también. Actualmente, existen programas capaces de generar composiciones en diversos estilos, lo que también permite a individuos sin formación musical formal crear obras complejas y técnicamente más avanzadas, sin conocimientos.

Hay quienes critican la genericidad de las canciones, la incoherencia de las voces o el sinsentido a veces, en los ritmos. Sin embargo, lo cierto es que la evolución tecnológica es notable. A pesar de que estos algoritmos tienen menos de un año de desarrollo y presentan imperfecciones, ya demuestran un potencial enorme. Podemos comparar sus creaciones con producciones musicales pasadas y actuales, y cada persona tendrá su propia opinión, pero todos podemos coincidir en que el progreso es indiscutible.

El proceso creativo humano nos ha distinguido desde los tiempos de las cavernas, con pinturas rupestres que servían tanto de documentación como de arte. A lo largo de nuestra evolución, hemos refinado estos procesos, incorporando elementos nuevos y variados que, aunque no siempre mejores ni al gusto de todos (¿Alguien dijo Autotune?), enriquecían nuestra expresión y creatividad. Conforme mejoraban nuestras herramientas, también se expandían nuestras capacidades creativas, llevándonos a alcanzar nuevos horizontes.

Y aquí estamos, en el año 2024, con una serie de tecnologías que nadie esperaba tan pronto. La que hoy te quiero enseñar es un «nuevo» modelo de Inteligencia Artificial dedicado especialmente a la creación de música, el proceso inicia con el usuario describiendo las distintas partes de la canción, el verso, el estribillo, etc y especificando el estilo musical deseado. El algoritmo entonces, analiza estas instrucciones y, basándose en su ingente cantidad de información aprendida a partir de música existente, genera una composición que se alinea con los criterios establecidos.

El núcleo de este proceso reside en el aprendizaje profundo y las redes neuronales, tecnologías que permiten a la IA «aprender» de ejemplos de música previamente compuesta. Estas redes se entrenan con grandes volúmenes de datos musicales, abarcando diversos géneros y estilos, para entender las estructuras y patrones que definen la música. Al recibir las instrucciones del usuario, la IA utiliza este aprendizaje para componer una pieza que no solo cumple con los requisitos dados, sino que también mantiene una coherencia musical interna.

Si lo que te interesa realmente es el resultado, puedes avanzar hacia la parte final del artículo, allí tienes seis canciones creadas utilizando estas herramientas, si de verdad te interesa informarte realmente sobre cómo funcionan y la tecnología detrás, has de saber que se llama Suno AI y podemos probarlo gratuitamente en su página, eso sí, con un número de créditos limitado que nos asignarán cada mes para hacer pruebas, si queremos algo más profundo y acceder a funcionalidades extra tendremos que contratar un plan superior, eso depende de las necesidades de cada uno, para probar lo de este artículo es suficiente con el plan gratuito. Detrás de Suno se encuentran algoritmos innovadores como Chirp y Bark, que son fundamentales en la transformación de cómo interactuamos con la creación musical. Chirp es experto en tejer intrincadas texturas musicales no vocales, diseñando paisajes sonoros que complementan las letras de una canción. Por otro lado, Bark se especializa en la creación de melodías vocales, añadiendo profundidad emocional y complejidad a las composiciones. Juntos, estos modelos de IA trabajan armónicamente para convertir simples instrucciones textuales en canciones completas y detalladas.

Para ilustrar este ejemplo vamos a crear tres canciones, no muy largas, utilizaremos la misma letra para todas pero con diferentes estilos. Al final te dejo los mismos ejemplos de canciones pero con otro algoritmo similar al de Suno, aun está en fase de pruebas y te regalan una cantidad bastante generosa de creaciones mensuales, se llama Udio y podrás compararlos por tu cuenta para decidir cuál es más útil para tus objetivos. Yo te recomiendo continuar con el artículo para ver cómo se utiliza Suno, ambos son muy parecidos y al final, una vez conozcas los pequeños detalles ya sí, probar ambos en profundidad.

Nada más entrar a Suno nos encontramos con el menú principal en el lateral izquierdo, ahí podemos iniciar el proceso de creación, acceder a nuestra biblioteca y la lista completa de la comunidad; en el centro, una lista de las últimas creaciones más relevantes, las que nos han gustado y nuevos estilos sugeridos. Abajo el reproductor que nos permitirá controlar la música durante el proceso.

Fácil, las distintas secciones de cualquier página web actual, tras seleccionar la opción de Create nos encontramos con un menú diferente, por defecto nos permite describir la canción que queremos crear, indicar si es instrumental, en caso de no tener voz y seleccionar el modelo del algoritmo, pocas diferencias hay entre ambos, el 3 es el más reciente y tiene mejoradas las voces, errores corregidos y en teoría permite más control sobre la canción, sobre todo con los finales, la versión 2 solía terminar las creaciones de forma abrupta, entre otros problemas.

Para una creación más flexible utilizaremos el Custom mode (Modo personalizado), en él ya podemos vislumbrar un poco más la profundidad de la cuestión que nos concierne, nos pide las letras de la canción y no una simple descripción de la misma, además podemos indicar el estilo de música y ponerle un título, también podemos elegir la opción de sólo instrumentales y la versión del modelo como antes. Para este modo, existen una serie de meta etiquetas que nos permiten dirigir un poco la creación indicándole a Suno a qué parte de nuestra canción corresponde cada uno de los párrafos, aunque para este ejemplo utilizaremos sólo tres, Verse, Chorus, y Bridge sin proporcionar ningún tipo de adjetivos extra, en su documentación podemos consultar las opciones recomendadas y cómo combinarlas entre sí.

Debemos tener en cuenta que los trozos de canción que genera suelen durar como máximo un minuto por lo que hay que ser cuidadosos con la cantidad de letra que le introducimos en cada una de las iteraciones para evitar problemas, es normal que mezcle trozos de letra, saltándose palabras si hay demasiado contenido o que añada cosas raras si le faltan textos, por lo general dos párrafos no muy largos por sección suelen ser lo óptimo, en Udio nos recomiendan mayor cantidad de textos para canciones rápidas y menos para las lentas. En nuestro ejemplo utilizaremos estas letras para nuestras canciones:

[Verse]
Luces que parpadean bajo el cielo gris,
historias escritas en un muro sin fin,
risas y lágrimas, mezcla sin igual,
la vida es un baile, ven, vamos a saltar.

[Chorus]
En la calle de los sueños perdidos,
bailan sombras que el tiempo olvidó,
en mis pasos llevo ritmos escondidos,
y en mi pecho, un corazón que no se rindió.

[Bridge]
Giramos y volamos en un carrusel,
cada vuelta es un mundo, cada paso un papel,
te tomo de la mano, no vamos a parar,
en esta danza loca, solo quiero bailar.

[Verse]
Sueños que como estrellas fugaces van,
iluminando noches, desvaneciendo el mar.
Que la música no pare, que siga hasta el final,
en esta fiesta eterna, todo es especial.

[Chorus]
En la calle de los sueños perdidos,
bailan sombras que el tiempo olvidó,
en mis pasos llevo ritmos escondidos,
y en mi pecho, un corazón que no se rindió.

[Outro]
En mis pasos llevo ritmos escondidos,
y en mi pecho, ¡un corazón que no se rindió!

El empezar con un Verse nos ayuda a hacer la canción mas corta pero normalmente empezaríamos con la etiqueta Intro para hacerlo de forma progresiva, pondremos de titular a nuestra canción «Calle de los sueños perdidos», letra y título creados por el ya más que trillado ChatGPT, sin ningún tipo de modificación más que para ajustar las etiquetas. Ahora que ya tenemos todo lo necesario para crear la canción vamos a rellenar el formulario con las letras de nuestra maravillosa letra con un estilo Pop/Rock español.

Tras añadir los requisitos presionamos el botón Create para que el algoritmo empiece a generar la canción, tras una corta espera, no más de un minuto por lo general, terminará de crearla y nos permitirá escuchar el resultado final; los resultados de ambas plataformas proporcionan dos audios por creación que podremos escuchar y seleccionar para utilizar como punto de partida a continuación.

Una vez sabemos cuál queremos utilizar podemos continuarla gracias al botón Extend, esto cargará el fragmento en el formulario de la izquierda, donde inicialmente escribimos las letras. Esta vez, el formulario incluirá opciones adicionales para hacer ajustes más específicos. Es particularmente útil el campo que permite continuar desde una posición específica, ideal si nos agrada todo el fragmento excepto su final. Esto nos permite eliminar la parte no deseada de manera efectiva.

Para simplemente continuar la canción desde el final del trozo seleccionado bastaría con modificar las letras introduciendo los dos párrafos siguientes, y darle a Continue. El proceso será el mismo que con la creación inicial, tras un minuto nos proporcionará de nuevo dos alternativas, sólo que ahora, en la lista podremos observar un nuevo detalle y es que aparece un pequeño indicador advirtiéndonos de que el fragmento pertenece a la segunda parte, proporcionándonos ahora una serie de opciones nuevas al pulsar los tres botones de la derecha; nos interesa la que dice Whole Song (Canción Completa), opción que se encargará de juntar los trozos seleccionados y entregarnos la canción entera hasta el punto actual, ya sólo tendríamos que continuar combinando todas y cada una de estas opciones para ir dando forma a nuestra composición final.

Aquí te dejo los resultados, tres canciones con la misma letra en diferentes estilos musicales, Pop/Rock, Bossanova y Reggaeton, distan bastante de ser perfectos y serán auténticos engendros para los realmente duchos en la producción musical, una composición musical probablemente bastante desequilibrada y pobre, voces que se van enlatando y difuminando, palabras, ritmos y notas sin sentido, etc. Pero reconocerás que para estar creado sin la intervención de un experto, en unos minutos, sin tocar ningún instrumento ni cantar una sóla nota, se trata de canciones que pasarían bastante desapercibidas de no saber que las ha creado un algoritmo de Inteligencia Artificial.

Esta es la versión Pop/Rock:

Aquí la Bossanova:

Y para «terminar», la versión Reggaeton:

Cada uno que juzgue por sí mismo, la calidad es la que es, las voces se nota que no son consistentes, en general, todavía es bastante pobre si lo comparamos con una producción profesional, es lógico, pero no olvidemos que este tipo de algoritmos no tienen más de un año de existencia, al menos a nivel práctico. La cuestión no es de lo que son capaces ahora, sino de qué serán capaces de hacer en unos años, a la vuelta de la esquina. Sin ir más allá, recientemente ha salido al público otro algoritmo de este tipo llamado Udio, hablábamos de él antes, funciona de forma similar a Suno, a fecha de hoy se encuentra en periodo de pruebas y te permite crear gratuitamente una cantidad considerable de canciones al mes, te invito a probarlo por ti mismo.

Las posibilidades de uso para esta tecnología son múltiples, desde una plataforma de streaming que no solo reproduzca música, sino que también la cree en tiempo real y completamente personalizada según el estado de ánimo, las actividades o incluso el clima del oyente, en terapias de relajación y bienestar, componiendo paisajes sonoros adaptados a las necesidades emocionales de cada usuario. Incluso podría permitir la creación rápida de bandas sonoras y efectos sonoros personalizados para películas, juegos y experiencias de realidad virtual, adaptándose dinámicamente a las acciones del usuario.

A medida que la tecnología de Inteligencia Artificial continúa avanzando en campos creativos, surge la necesidad de replantear las normativas actuales sobre derechos de autor. En el contexto de las plataformas de creación como Suno y Udio, las políticas de propiedad varían significativamente. Por ejemplo, en Suno, las creaciones realizadas a través de cuentas de pago son propiedad exclusiva del creador, otorgándoles plena libertad para comercializar o distribuir su obra sin restricciones adicionales. En contraste, Udio, requiere que los usuarios hagan atribución en las obras generadas, independientemente del uso que se les dé. Este panorama plantea un debate interesante sobre la propiedad intelectual en la era digital y sugiere que las legislaciones de derechos de autor podrían necesitar adaptaciones para mantener el equilibrio entre los derechos de los creadores y las capacidades de las nuevas tecnologías.

Estas son los fragmentos generados para la misma canción y con los mismos estilos pero utilizando el algoritmo de Udio:

Versión Pop/Rock:

La versión Bossanova:

Reggaetón:

Ahora surgen las preguntas: ¿Las máquinas nos robarán la creatividad? ¿Perderán valor las obras artísticas? La respuesta, en mi humilde opinión, es definitiva y rotundamente, no. La creatividad humana es intrínseca a nuestra naturaleza y seguirá existiendo mientras estemos aquí. Nuestro legado cultural perdurará a menos que sea borrado por el paso del tiempo. Lejos de extinguir la creatividad humana, la Inteligencia Artificial y los algoritmos que generan texto, imágenes, audio y video la enriquecerán y potenciarán.

En un mundo saturado de información a menudo falsa, relaciones digitales y una economía cada vez más virtual, incluso la música, el tema central de este artículo, se rige por patrones estandarizados para crear «éxitos» comerciales. Lo mismo sucede en el cine y los videojuegos, donde muchas creaciones parecen derivadas de una plantilla genérica destinada simplemente a generar ingresos. Estos algoritmos, al igual que en el procesamiento del lenguaje y las imágenes, desplazarán trabajos en la producción industrializada de contenido, donde la innovación real es a menudo sacrificada por la rentabilidad. Sin embargo, los verdaderos artistas, aquellos para quienes la creatividad fluye genuinamente, encontrarán en estas herramientas una manera de trascender los límites convencionales y nos llevarán a explorar nuevos horizontes.

Las creaciones artificiales y las naturales competirán en el mercado, destacándose por una diferencia crucial: su valor. Las obras humanas auténticas, con su naturaleza orgánica y única, adquirirán un valor incalculable, sobresaliendo frente a lo genérico y artificial. A medida que Internet se inunda con contenido generado por Inteligencia Artificial, esta tendencia se intensificará. Sin embargo, frente a la creciente mediocridad de las creaciones artificiales, las obras verdaderamente valiosas creadas por humanos, realmente originales, destacarán aún más.

Para concluir, solo puedo recomendar lo de siempre: investiga, experimenta y explora cómo estas herramientas pueden potenciar y facilitar tu creatividad si eres un creador nato. La tecnología, usada sabiamente, no es un obstáculo sino un amplificador de nuestro potencial. Puedes utilizar la caja de comentarios para decirnos qué te parecen las canciones o para contarnos tu punto de vista si lo consideras oportuno. Por mi parte, sólo espero haber proporcionado una visión primeriza y un pequeño entendimiento sobre esta tecnología emergente que promete transformar nuestra interacción con la mismísima realidad.

Alberto Méndez

Desarrollador de software, informático, emprendedor y entusiasta por la tecnología desde tiempos inmemoriales. Inquieto por defecto, curioso por naturaleza, trato de entender el mundo y mejorarlo utilizando la tecnología como herramienta.

12 de abril de 2024 Alberto Méndez

géneros inteligencia estilos musical letra musica patrones tecnología músicos datos algoritmo suno creacion udio instrumento ia composición inteligencia artificial producción

Leave a Comment Cancelar la respuesta