Direkt zum Inhalt

Über intelligente Generatoren

Autor andre
Teaser Image

Künstliche Intelligenz gibt es schon seit Jahrzehnten, aber erst seit kurzem sind neuronale Netze, insbesondere Deep Learning, wieder ein heißes Thema. Ich möchte dir einen kleinen Einblick in die Sichtweise von Cognitone zu diesem Thema geben und dir zeigen, was wir derzeit in Bezug auf neue intelligente Funktionen für Synfire tun.

Deine Phrasen - deine Musik

Eine der einzigartigen Stärken von Synfire ist, dass du beliebiges MIDI-Material, einschließlich deiner eigenen Takes, sammeln kannst, um eine große Vielfalt an musikalischen Ausdrücken (Phrasen) für die beliebige Wiederverwendung, Umwandlung und Kombination zu erhalten. Es macht Spaß, mit den Beispielphrasen zu spielen, die bereits in Synfire enthalten sind, aber die Aussicht, eigene Musik auf der Grundlage deiner eigenen Ausdrucksformen zu erstellen, ist natürlich noch verlockender.

Wenn du erst einmal den Dreh raus hast, deine eigenen Phrasen zu erstellen, wird das schnell zur Routine. Wenn du mit deinem eigenen Material arbeitest (woher auch immer du es hast), wird dein Output nicht durch ein fest verdrahtetes Konzept von musikalischem Stil und Struktur oder durch einen Zufallsgenerator begrenzt, der magische Dinge tut, die du nicht kontrollieren kannst.

Zugegeben, um diese Art von Freiheit wirklich zu genießen, musst du im Vorfeld ein bisschen Arbeit investieren. Wäre es nicht schön, wenn dies ein assistierter und weitgehend automatisierter Arbeitsablauf wäre? Stell dir die Produktivität, den Spaß, die sofortige Belohnung und die glücklichen Überraschungen vor, die das mit sich bringen würde.

Phrasen generieren

Cognitone forscht derzeit an einer neuen Technologie, die das Erstellen neuer Phrasen, Harmony Progressions, Parameter und vielleicht sogar ganzer Songs erleichtert, indem sie unterstützende und automatisierte Elemente in den Arbeitsablauf einführt.

Generatoren gefällig? Nun, nicht so schnell. Um effektiv zu sein, muss jeder Musikgenerator autonome Entscheidungen treffen. Egal, ob es sich dabei um vollständig synthetische Ergebnisse handelt (z. B. aus Fraktalen oder Funktionen) oder um eine Mischung aus zuvor trainierten Mustern (z. B. die Ergebnisse eines neuronalen Faltungsnetzwerks). Vor dem jüngsten Boom neuronaler Netze gab es in der KI viele symbolische generative Konzepte wie generative Grammatiken, endliche Automaten, vorwärtsgerichtete Regelsysteme und mehr. All diese Konzepte können immer noch für die Erzeugung von Musik genutzt werden.

Der Zufall ist jedoch nur bis zu einem gewissen Grad zufriedenstellend, denn Musik ist nicht nur eine Abfolge von Noten. Die oft langweiligen und wenig eingängigen Ergebnisse von Zufallsgeneratoren und -automaten zeigen das seit Jahren.

Musik ist eine Sprache

Man sagt, dass Musik eine Sprache ist, die überall verstanden wird. Tatsächlich ist sie eine vollwertige Sprache mit einem Wortschatz, einer Grammatik und einer Semantik. Das erklärt auch, warum es mit dem Zufall nicht getan ist: Stell dir vor, du würdest die Wörter oder Buchstaben eines Buches zufällig auswählen. Nicht viele Menschen würden das lesen wollen. Um sinnvolle Ergebnisse zu erzielen, muss ein Generator die Regeln einer Sprache berücksichtigen.

Gute Komponistinnen und Komponisten haben immer ihre eigene Sprache des musikalischen Ausdrucks definiert und ihre Werke auf der Grundlage dieser Sprache aufgebaut. Musik kann als ein Korpus von Wörtern, Sätzen und Absätzen einer Sprache betrachtet werden. Das ist es, was einen Stil ausmacht. Und es ist das, was einen Komponisten auszeichnet.

Stil ist nicht fest verdrahtet

Elemente einer Sprache (z. B. Coda & Reprise, Frage & Antwort) zu festen Steuerelementen einer Benutzeroberfläche zu machen, ist vielleicht nicht die beste Idee, es sei denn, die Software ist für eine bestimmte Reihe von Musikgenres und -epochen konzipiert und für nichts anderes. Es gibt einfach zu viele verschiedene Sprachen da draußen. Was ist, wenn meine Musik auf verschiedenen Elementen basiert?

Jenseits der parametrischen Zufälligkeit

Ein Allzweckgenerator erfordert eine anpassbare Definition einer Sprache, deren viele Parameter dann innerhalb ihres Bereichs zufällig bestimmt werden können. Der Nachteil dieses einfachen Ansatzes ist jedoch, dass Cognitone (oder jeder andere Entwickler) unmöglich Hunderte, wenn nicht Tausende solcher Sprachdefinitionen im Voraus erstellen kann. Abgesehen von den enormen Vorlaufkosten ist wahrscheinlich keine einzige Person in der Lage, alle Feinheiten eines jeden Musikstils zu verstehen und zu kodieren. Und selbst wenn jemand das könnte, gibt es wahrscheinlich immer noch Komponisten, die nicht das finden, was sie suchen, egal wie viele Stile man erstellt.

Deshalb experimentiert Cognitone derzeit mit einer Technologie, die es Nutzern ermöglicht, ihre eigenen musikalischen Sprachelemente und Strukturen zu definieren, die Synfire dann zur Generierung von Phrasen, Teilen und möglicherweise ganzen Songs verwendet. Im Idealfall können diese Sprachen, genau wie Arrangements und andere Dateien, gemeinsam genutzt und verändert werden.

Neuronale Netzwerke

Wenn wir schon dabei sind, sollte ich erwähnen, dass ich den größten Teil des Jahres 2017 damit verbracht habe, mit neuronalen Faltungsnetzwerken (CNN, Deep Learning) zu experimentieren und zu dem Schluss gekommen bin, dass sie für diesen Zweck nicht geeignet sind. Erstens wurden diese Netze in erster Linie für Erkennungsaufgaben und nicht für die Generierung von Daten entwickelt. Zweitens ist es eine enorme Aufgabe, diese Netze auf alle vorstellbaren Stile zu trainieren, die unsere Nutzer möglicherweise komponieren wollen. Die erforderlichen beschrifteten Daten gibt es einfach nicht und sie von Grund auf neu zu erstellen ist ein enormer Aufwand.

Und drittens möchte niemand mit klischeehaften Variationen ähnlicher Ausgaben enden, die Tausende von anderen auch erstellt haben. Deshalb möchtest du eine feinere Kontrolle über den Stil haben, wenn nicht sogar deinen eigenen erstellen. Einen klaren Weg dorthin gibt es noch nicht.

Deep Learning ist derzeit der letzte Schrei. Für das Komponieren von Originalmusik ist es jedoch nur bedingt geeignet, zumindest in seinem jetzigen Zustand.

Ausblick

Auch wenn es noch keine Schätzung gibt, ob und wann etwas davon als neue Funktion auftauchen wird, dachte ich mir, es wäre schön, euch wissen zu lassen, was hier hinter den Kulissen vor sich geht, zusätzlich zu der täglichen Softwareentwicklung rund um unsere Agenda, die immer weiter voranschreitet.

(Kommentare sind in diesem Thread willkommen)