Ein weiteres früheres Einsatzgebiet für künstliche Intelligenz ist die sogenannte Produktionsmusik. Dabei werden Musikdatenbanken erstellt, die von Herstellern von TV- und Spielfilmen, Werbung und Games genutzt werden können, um kostengünstig Musik zu erwerben. Ein weiteres Gebiet der Musikproduktion, in der KI nicht mehr wegzudenken ist, ist das Mastern von Musikaufnahmen, für das früher ein gutes Gehör und viel Erfahrung erforderte, nunmehr aber immer öfter von KI-Anwendungen übernommen wird.
Ausgangspunkt für die Anwendung der KI beim Musikproduzieren ist die MIDI-Technologie, die Anfang der 1980-er Jahre Eingang ins Musikproduzieren gefunden hat. MIDI steht für Musical Instrument Digital Interface und ist ein Programm zum Austausch von musikalischen Steuerungsinformationen, die digitale und analoge Musikinstrumente miteinander verbindet. Die Idee dazu hatte Dave Smith, nachdem er an der University of Calfornia Berkeley ein Informatik- und Elektrotechnik-Studium abgeschlossen hatte. 1974 gründete er das Unternehmen Sequential Circuits, mit dem er verschiedene Klangerzeugungsmaschinen wie Sequenzer und Synthesizer herstellte. Was ihn aber störte war, dass die Synthesizer, die anfangs nur wenige Noten spielen konnten, nicht über ein Keyboard mit anderen Synthesizern verknüpft werden konnten, um den Tonumfang zu vergrößern. Die Lösung bestand darin, eine Schnittstelle zu programmieren, über die mittels Kabelverbindung Audiosignale ausgetauscht werden konnten.1 Smith stellte das MIDI 1.0-Protokoll2 1981 der Audio Engineering Society erstmals vor und zeigte zwei Jahre später auf der Messe der National Association of Music Merchants (NAMM), wie die technische Umsetzung funktionierte, indem er ein Gerät aus eigener Produktion mit einem Konkurrenzprodukt der Firma Roland koppelte.3 Der Erfolg war überwältigend und MIDI wurde sehr schnell zum Industriestandard beim Verbinden jeglicher Musikinstrumente.
Die MIDI-Schnittstelle fand schnell auch Eingang in die Musikproduktion. Tonstudios steuerten damit nicht nur zahlreiche Synthesizer und andere digitale Klagerzeuger, sondern verbanden die Instrumente auch mit dem Computer, um die Musikaufnahmen einfach und kostengünstig editieren zu können. Bald schon kamen auch Audiowandler zum Einsatz, mit denen MIDI-Files aus analogen Instrumenten wie akustische Gitarren oder Saxophone gewonnen werden konnten. So entstanden mit der Zeit riesige MIDI-Datenbanken, auf die MusikproduzentInnen in ihrer Arbeit zugreifen konnten.4
Allerdings war die Tonqualität dieser Musikdatenbanken bescheiden. Das bemerkte auch der Filmkomponist Herbert Tucmandl, der in Wien Cello und Kameraführung studiert hatte und der später selbst Filme produzierte. Die Filmmusik dazu bastelte er selbst am Computer und mit den damals verfügbaren Orchestermusikdatenbanken zusammen. Allerdings waren die Datenbanken auf 6.000 Orchestersamples mit meist schlechter Tonqualität beschränkt. Deshalb hatte Tucmandl die Idee, nicht nur einzelne Töne, sondern ganze Phrasen einzuspielen und aufzunehmen, womit 2000 die Vienna Symphonic Library (VSL)5 geboren war, die innerhalb von drei Jahren auf über eine Million Samples anwuchs. Finanziert wurde das Projekt mit Risikokapital des Schweizer Investors Markus Kopf.6 Sein Geld war gut angelegt, da die VSL in kürzester Zeit zum Goldstandard der Musikdatenbanken wurde und weltweit von MusikproduzentInnen genutzt wurde, um kostengünstig Musik für Werbung, Spiel- und TV-Filme sowie Games zu produzieren.
Diese Art von Musik wird auch als Produktionsmusik (production music oder library music) bezeichnet, deren Geschäftsmodell auf die 1909 in London gegründete De Wolfe Music zurückgeht.7 Der aus den Niederlanden stammenden Musiker und Dirigent Meyer De Wolfe, war nach London gekommen, um dort als Dirigent von Kino-Orchestern, die Stummfilme live begleiteten, zu arbeiten. Er erkannte, dass es sehr zeitraubend war, preiswertes Notenmaterial für Kinoaufführungen zu bekommen, das er teilweise selbst erstellen musste. Er gründete daraufhin einen Musikverlag, der ein Notenarchiv speziell für Stummfilm-Musikbegleitung aufbaute. Als 1927 der Tonfilm die Welt im Sturm eroberte, war das Geschäftsmodell von De Wolfe Music massiv bedroht. Die innovative Antwort von Meyer De Wolfe war der Einsatz des Lichttonverfahrens, bei dem die Filmmusik auf einem 35mm-Nitratfilm aufgenommen wurde, der mit der Filmrolle verbunden bzw. synchronisiert werden konnte. Das Notenarchiv der De Wolfe Music wurde mit einem Archiv von Musikaufnahmen ergänzt. Damit war die Produktionsmusik geboren. De Wolfe war in der Lage, kostengünstige Gebrauchsmusik für die Newsreels, also Wochenschauberichte, die vor einem Kinofilm gezeigt wurden, zu produzieren. Zu den Kunden zählten bald nicht nur die britischen Studios, sondern auch Filmhersteller in ganz Europa. In den 1940-er Jahren expandierte De Wolf Music auch in die USA, wo das Fernsehen bereits in der Frühphase seiner Entwicklung war und das Unternehmen Musik für die ersten Werbespots produzierte. 1955 wurde im Vereinigten Königreich der erste Werbespot der britischen TV-Geschichte für Gibbs Zahnpasta mit Musikuntermalung von De Wolf ausgestrahlt.8
Nach dem Vorbild von De Wolf Music wurden weitere Produktionsmusikfirmen gegründet, die ihre eigenen Musikdatenbanken aufbauten. Das Ertragsmodell beruht bis heute zum einen auf der Einhebung von Lizenz- bzw. Synchronisationsentgelten für den Zugriff auf die Datenbank und zum anderen auf Tantiemen, die von Musikverwertungsgesellschaften für die Nutzung der Musik eingehoben werden. Produktionsmusikfirmen haben den Vorteil, dass sie nicht nur die Urheberrechte an den Musikwerken, sondern auch die Leistungsschutzrechte an den Aufnahmen kontrollieren und deshalb Lizenzpakete zu einem günstigeren Preis anbieten können.9
Es ist wenig verwunderlich, dass Produktionsmusik, die in großen Datenbanken gespeichert ist, ein frühes Anwendungsgebiet für künstliche Intelligenz im Musikbereich wurde. Die Sound-Samples, die ursprünglich von KomponistInnen geschaffen wurden, kann mit KI wesentlich kostengünstiger hergestellt und die Lizenzentgelte bzw. Tantiemen müssen nicht mit UrheberInnen geteilt werden. Besonders gut geeignet für von KI erzeugte Produktionsmusik sind MIDI-Datenbanken, weil die Samples in einer technisch einfachen Form vorliegen. MIDI-Files eignen sich auch hervorragend zum Komponieren und Erstellen von Musikaufnahmen. Mittlerweile gibt es zahlreiche KI-Musikkreationstools, die mit MIDI-Dateien arbeiten, wie das Magenta Studio von Google oder das MuseNet von Open AI, die noch ausführlich im nächsten Kapitel besprochen werden.
Ein weiteres wichtiges Anwendungsgebiet für die KI in der Musikproduktion ist das Mastering geworden. Wenn eine Musikaufnahme in der Stereomix-Version vorliegt, besteht das Mastering darin, die einzelnen klanglichen Elemente auszubalancieren, sodass der finale Song in allen Medienformaten, vom Handy bis zum High-End Soundsystem, perfekt klingt.10 Dazu hat bislang ein sehr gutes Gehör und teures Equipment gehört, um zu einem befriedigenden Endergebnis zu kommen. Mithilfe der KI lässt sich der Mastering-Prozess weitgehend automatisieren. Dazu bietet beispielsweise die Mastering-Firma LANDR ein Online-gestütztes KI-Mastering-Tool an, das, wie ein Erklärvideo ausführt, extrem leicht zu bedienen ist.11 Ein hochauflösendes Audiofile im wav- oder aiff-Format des bereits gemixten Songs kann online auf die Plattform hochgeladen werden. Es kann dann auch drei verschiedenen Mastering-Stilen und Lautstärkenniveaus gewählt werden. Nach ein paar Klicks, kann auch schon der Mastering-Prozess gestartet werden, an dessen Ende der Song dann als wav-, mp3- oder HD-wav-File ausgegeben werden kann. Die gemasterte Aufnahme kann dann direkt auf Streaming- und Social Media-Plattformen gestellt bzw. mit anderen geteilt werden.12 Und das alles für knapp 20 Euro im Monat (Stand: Dezember 2023).13
Nach eigenen Angaben zählt LANDR die Labels der Warner Music Group zu ihren Kunden. Das kommt nicht von ungefähr, da Warner 2015 US $6,2 Millionen in das 2014 von Pascal Pilon im kanadischen Montréal gegründete Unternehmen investiert hat.14 LANDR, der Firmenname ist ein Akronym für Left AND Right, ist aus dem KI-Start-up MixGenius entstanden, in das Pilon 2014 mit seiner Investmentfirma YUL Ventures Risikokapital gesteckt hat. Pilon positionierte LANDR von Anfang an als Online-Masteringplattform für DIY-KünstlerInnen, die sich teure Masteringstudios nicht leisten können.15 In einem Billboard-Artikel wird geschätzt, dass es weltweit rund 500 bis 800 Masteringstudios gibt, die pro gemasteter Aufnahme mehrere hundert US-Dollar verlangen, was sich bei einem Album gleich einmal auf mehrere tausend Dollar summieren kann.16 Pilon hatte selbst beobachtet, dass auf YouTube lediglich ein Prozent der hochgeladenen Musikvideos gemastert waren und sah für LANDR eine Marktlücke, indem das Service niederschwellig über das Internet angeboten wurde. Seit 2018 bietet LANDR neben dem Online-Mastering auch einen digitalen Musikvertrieb an, über den die fertig gemasterten Aufnahmen direkt auf die wichtigsten Musikstreamingplattformen gestellt werden können. Im gleichen Jahr machte LANDR auch seine Musiksample-Datenbank für AbonnentInnen zugänglich, womit das Unternehmen auch am Markt für Produktionsmusik mitmischt.
Mittlerweile sind zahlreiche weitere KI-Masteringstudios im Internet aktiv geworden, wie das vom mehrfach mit Platin ausgezeichneten Musikproduzenten und Grammy-Gewinner Smith Carlson ins Leben gerufene eMastered-Studio17 oder das Open-Source-Projekt Songmastr.18 Die Geschäftsmodelle sind ähnlich. Es können fertig gemixte Sounddateien online auf die Plattform hochgeladen werden und ein KI-Algorithmus übernimmt dann das Mastering, wobei neben Gratis-Einstiegsversionen monatliche Abo-Modelle angeboten werden.
Peter Tschmuck
Dieser Artikel erschien erstmal am 26. Feber 2024 auf der Seite https://musikwirtschaftsforschung.wordpress.com/2024/02/26/ki-in-der-musikindustrie-teil-7-ki-in-der-musikproduktion/
Teil 1: Was ist künstliche Intelligenz?
Teil 2: Wie funktioniert künstliche Intelligenz?
Teil 3: Der Aufstieg von Musikerkennungsdiensten
Teil 4: KI in der Musikerkennung und Musikempfehlung
Teil 5: Die Musikempfehlung im Musikstreaming
Teil 6: Fake-Streams und Streamingfarmen
Peter Tschmuck ist Professor am Institut für Popularmusik (ipop) der mdw.
Endnoten
- Eine ausführliche Würdigung von Dave Smiths Leistungen können in einem Nachruf auf ein Ableben am 31. Mai 2022 aus Heise.de nachgelesen werden: „MIDI-Entwickler und Sound-Pionier: Dave Smith ist tot“, 3. Juni 2022, Zugriff am 18.12.2023. ↩︎
- Der Gralshüter der MIDI-Technologie ist die MIDI Association, auf deren Homepage auch das MIDI 1.0-Protokoll nachgelesen werden kann: MIDI Association, „MID 1.0“, o.D., Zugriff am 18.12.2023. ↩︎
- Der Gründer und damalige CEO der Roland Corporation, Ikutaro Kakehashi, erhielt für diese Leistung 2013 gemeinsam mit Dave Smith den Technik-Grammy, die vom Grammy-Preisträger Dave Stewart gewürdigt wurde: Dave Stewart, „Technical GRAMMY Award: Ikutaro Kakehashi And Dave Smith“, www.grammy.com, 3. Dezember 2014, Zugriff am 18.12.2023. ↩︎
- Der Standard, „Wie künstliche Intelligenz heute schon bei der Musikproduktion hilft“ von Stefan Mey, 12. Februar 2023, Zugriff am 18.12.2023. ↩︎
- Vienna Symphonic Library, https://www.vsl.co.at/de, o.D., Zugriff am 19.12.2023. ↩︎
- Der Spiegel, „Die Wiener Schnipsel-Musikanten“, 28. Dezember 2003, Zugriff am 19.12.2023. ↩︎
- Die ausführlichen Unternehmensgeschichte kann auf der Homepage von De Wolfe Music nachgelesen werden: „110 Years of De Wolfe Music“, o.D., Zugriff am 19.12.2023. ↩︎
- YouTube, „UK’s First Television Advert – Gibbs SR Toothpaste“, 29. September 2011, Zugriff am 19.12.2023. ↩︎
- Siehe dazu den Abschnitt „Produktionsmusikverlage/Archivmusikverlage“, S. 154-158 in Christian Baierle, 2009, Der Musikverlag, München: Musikmarkt Verlag. ↩︎
- Eine gute Einführung, inklusive Erklärvideo, wie Mastering funktioniert, bietet die Mastering-Firma LANDR, die für die Label der Warner Music Group arbeitet: „What is Mastering? Why Master Your Tracks Before Release?“, o.D., Zugriff am 20.12.2023. ↩︎
- LANDR, „Das Erste. Das Beste. Unübertroffenes KI-Mastering“, o.D., Zugriff am 20.12.2023. ↩︎
- LANDR, „Veröffentliche deine Musik in nur 2 Tagen“, o.D., Zugriff am 20.12.2023. ↩︎
- LANDR, „Preise“, o.D., Zugriff am 20.12.2023. ↩︎
- 2019 konnte LANDR in einer zweiten Investmentrunde weitere US $26 Millionen einsammeln. Siehe: Music Business Worldwide, „LANDR closes $26m Series B funding round“, 16. Juli 2019, Zugriff am 20.12.2023. ↩︎
- Devenir entrepreneur, „How LANDR is revolutionizing postproduction in music. Pascal Pilon’s Story“, 4. November 2016, Zugriff am 20.12.2023. ↩︎
- Billboard, „LANDR Brings Music Mastering to the Cloud, Helping Major Labels & Bedroom Acts Alike“, 19. Februar 2019, Zugriff am 20.12.2023. ↩︎
- eMastered, „Master Your Track, Instantly“, o.D., Zugriff am 20.12.2023. ↩︎
- Songmastr, “ https://www.songmastr.com/“, o.D., Zugriff am 20.12.2023. ↩︎
