Úvod
Představení tématu a významu AI v hudebním průmyslu
Během posledních několika let jsme mohli být svědkem revolučního vývoje na poli umělé inteligence. S rozvojem jazykových modelů založeném na hlubokém učení, zejména pak typu jazykových modelů využívajících více hlavový mechanismus pozornosti, přišel neočekávaný převrat ve zpracování přirozeného jazyka, počítačového vidění nebo generování obrazů z textu. Tato cesta vývoje navždy proměnila řadu oblastí, jak na pracovním trhu, tak v každodenním životě člověka. Neméně důležitou oblastí, která byla postihnuta bylo také zpracování zvuku a s ním spojený hudební průmysl.
Význam AI v hudebním průmyslu stále roste a s nimi i plynoucí výhody a nevýhody. Konzument či hudební laik se již dnes nemusí spoléhat na lidské interprety nebo své vlastní schopnosti, ale z pohodlí domova může za pomocí promptu vytvořit vlastní hudbu. Ovšem z pohledu profesionálního hudebního interpreta může být využívání AI pomyslným dvousečným mečem, kdy může práci zefektivnit, ale ukrývá se zde i riziko, v podobě snížené poptávky na pracovním trhu, a i možného ohrožení autorského práva.
Esej se zaměřuje na konkrétní aplikaci AI v mnoha podoblastí tohoto odvětví a jakými možnými způsoby zefektivňuje procesy v generování a produkci hudby. Konkrétní aplikace jsou dále autorem představeny.
Metody
V eseji se využívají zejména metody systematické rešerše a posléze také metoda komparace nad konkrétními aplikacemi umělé inteligence. Pro zkoumání zmíněné problematiky bylo zásadní čerpat pouze ze zdrojů, které můžeme označit za evidence based. Níže je několik zdrojů, ve kterých autor vyhledával a z nichž tato práce vychází.
- Google Scholar
- Web of Science
- Scopus
- Oficiální stránky aplikací
Samozřejmě existuje i více evidence based zdrojů, ve kterých mohl autor vyhledávat. Nicméně tyto si autor zvolil, jelikož již byly osvědčené a literatura z nich získaná patří mezi akademicky respektované. K popisu jednotlivých aplikací byly také za zdroj používány jejich oficiální stránky.
1. Generování hudby za pomoci AI
Nejznatelnější využití umělé inteligence lze sledovat v generování samotné hudby. První nástroje byly využívány k vytváření náhodných skladeb a využívaly algoritmické a procedurální generování. To bylo v souladu s pravidly, která se mnohdy blížila spíše notovému zápisu. Větší posun ve vývoji hlubokého učení vedl k rozvoji sofistikovanějších AI systémů, které dnes umožňují vytváření skladeb, jež jsou téměř k nerozeznání od skladeb reálných interpretů. Především neuronové sítě GAN (Generative Adversarial Networks), RNN (Recurrent Neural Networks) a Transformery přinesli revoluci v generování hudby (Hernandez-Olivan, C. et al., 2022).
1.1 EMI
Moderní vývoj inspiroval zejména průkopnický projekt Davida Copea, Experiments in Musical Intelligence (EMI) na konci 20. století, jehož hlavním cílem bylo zkoumat, jak může umělá inteligence napodobovat hudební styly známých skladatelů. EMI tak analyzoval hudební díla skladatelů jako Johana Sebastiana Bacha, Wolfganga Amadea Mozarta nebo Ludwiga Van Beethovena. Na základě analýz model vygeneroval nové skladby, jež se věrně držely konkrétního stylu skladatele. AI model ku příkladu vytvořil skladbu ve stylu Bacha, která byla dokonce i zahrána na koncertě a publikum ji považovali za autentické dílo autora. Vygenerované skladby byly natolik realistické, že ani mnoho odborníků nedokázalo rozpoznat, zda jde o díla člověka nebo umělé inteligence (Coenen A., David Cope; 1997).
Projekt vyvolal řadu diskusí. Někteří kritici tvrdili, že hudba vytvořená EMI postrádá emocionální hloubku, kterou do svých děl vnášejí lidští skladatelé. Na druhou stranu byl projekt jinými obhajován jako důkaz schopnosti umělé inteligence přispívat k umění. EMI následně ovlivnil vývoj novějších systémů pro generování hudby, jako je MuseNet nebo AIVA (da Silva, P., 2003).
1.1 MuseNet
V roce 2019 přišla společnost OpenAI s hlubokou neuronovou sítí MuseNet, která dokázala generovat 4minutové skladby s použitím 10 různých nástrojů a kombinovat hudební styly od country až po klasickou hudbu. Od prosince roku 2022 ovšem již nelze model využívat, neboť byl odstaven a je nyní nedostupný (OpenAI, 2019).
1.2 MusicAgent
V současné době existuje rozmanitý výběr produktů se zaměřením na generování hudby. Mezi nejnovější produkty v oblasti využívání umělé inteligence můžeme zařadit pokročilý AI systém MusicAgent, který propojuje technologii velkých jazykových modelů a nástrojů pro práci s hudbou. Projekt z roku 2023 byl veden týmem výzkumníků a podporován akademickými institucemi. Hlavními vlastnostmi modelu je zejména porozumění hudbě a personalizace. Model tak dokáže analyzovat klíčové hudební prvky jako melodii, harmonii či rytmus. Zároveň se přizpůsobuje požadavkům uživatelů a umožňuje tak vytvářet hudbu na základě jejich preferencí. Mimo to je systém flexibilní a je snadno rozšiřitelný o nové funkce (Yu, D. et al., 2023).
1.3 Suno AI
Suno AI je dalším populárním specializovaným softwarem na generování hudby. Suno je pro veřejnost dostupné již od 20. prosince roku 2023, po spuštění webové aplikace. Software vznikl také díky partnerstvím se společností Microsoft, jež integrovala Suno mezi pluginy ve svém vydaném systému Microsoft Copilot. Pomocí této spolupráce mohou uživatelé vytvářet plně zformované písně včetně textů, instrumentů a vokálů pouhým zadáním jednoduchého textového promptu bez nutnosti předchozích hudebních dovedností. Verze V4 je nejnovější verzí modelu, který společnost oznámila v listopadu roku 2024. Oproti předešlé verzi dokáže vytvářet vysoce kvalitní zvuk, psát texty písní a remasterovat písně vytvořené v předchozích verzích (Suno AI, 2024).
Obrázek 1: Domovská stránka programu SunoAI (Suno.com, 2024)
V červnu 2024 se společnost Suno AI dostala do potíží, když na ni velké hudební vydavatelské společnosti, včetně Universal Music Group, Sony Music Entertainment a Warner Music Group, podaly žalobu kvůli údajnému porušování autorských práv. Tyto strany sporu obvinily společnost Suno a další startupy AI, jako je Udio, že neoprávněně vycvičily své modely AI pomocí chráněných hudebních nahrávek (Tencer D., 2024).
K tomu, aby mohl uživatel využít všechny funkcionality Suno AI, je nutné si založit účet. Po založení účtu má uživatel možnost volby mezi jednoduchým a uživatelským režimem. Jednoduchý mód je ideálním pro úplné začátečníky, protože umožňuje popsat požadovanou skladbu zadáním nálady, žánru a nástrojů. Uživatelský vlastní režim nabízí na druhé straně větší kontrolu, protože umožňuje zadat vlastní text a dolaďovat hudební parametry podle svých preferencí (Suno AI, 2024).
1.3.1 Výhody užívání
- Jednoduché používání: rozhraní je uživatelsky přívětivé a intuitivní a nezáleží na tom, zda se uživatel vyzná v hudbě, stejně ho dokáže používat.
- Je přizpůsobivý: lze vytvářet hudbu v různých žánrech a také v různých jazycích.
- Skvělý výstup: software dokáže vykreslit hudbu, která zní podobně jako u profesionálních hudebníků.
1.3.2 Nevýhody užívání
- Obavy o autorská práva a závislost na kvalitě vstupů.
- Věrnost hlasu umělé inteligence: Některé syntetické projevy mohou působit mechanicky nebo značně pozměněny.
(Suno AI, 2024)
1.4 Udio
Další nejvýznamnější aplikací pro generování hudby je Udio. Stejně jako Suno i Udio nabízí generování hudby za využití textového promptu. Udio bylo vyvinuto týmem bývalých výzkumníků z Google DeepMind, vedeným CEO Davidem Dingem. Projekt získal významnou podporu od venture kapitálové firmy Andreessen Horowitz (Udio, 2024).

Obrázek 2 : Domovská stránka programu Udio (Udio.com, 2024)
1.4.1 Výhody užívání
- Uživatelsky přívětivý.
- Dokáže produkovat emotivnější hudbu.
- Možnost exportu souboru v mnoha formátech.
1.4.2 Nevýhody užívání
- Vygenerované skladby jsou časově omezeny pouze na dvě minuty.
- Nedostatek určitých nástrojů.
- Možné problémy s autorskými právy.
1.5 AIVA
Alternativou oproti Suno AI a Udio je program AIVA. Program dokáže vygenerovat hudbu ve více než 250 rozdílných hudebních stylech (aiva.ai, 2024). Jako první virtuální skladatel na světě byla AIVA zaregistrována u hudební organizace SACEM, jež spravuje autorská práva. Díky tomu si mohou uživatelé v případě předplatného generovat vlastní hudbu s licencí a nemusí se tak obávat porušení autorských práv (archive.org, 2016).

Obrázek 3: Domovská stránka programu AIVA (aiva.ai, 2024)
1.5.1 Výhody užívání
- Možnost licence na vygenerovanou hudbu.
- Uživatelsky přívětivý.
1.5.2 Nevýhody užívání
- Kratší délka vygenerovaného hudebního klipu.
2. AI v hudební produkci
Kromě generování hudby má umělá inteligence také potenciál transformovat hudební produkci tím, že dokáže zvyšovat efektivitu procesu mixování. Populárními nástroji při mixování hudby patří například technologie jako iZotope Neutron, CloudBounce nebo LANDR. Podle studie „Adoption of AI technology in the music mixing workflow: An investigation.“ se přijetí AI nástrojů v mixování hudby výrazně liší napříč uživatelskými skupinami. U amatérských uživatelů se projevuje větší ochota nástroje využívat oproti profesionálům. Konkrétními přínosy AI v mixování je, že skladby obsažené v albech zní vyrovnaně a konsistentně. Zároveň také urychluje workflow a šetří tak čas automatizací základních úkolů. Díky tomu se mohou uživatelé čistě věnovat kreativnímu aspektu práce s hudbou (Vanka et al., 2023).
3. Závěr
Umělá inteligence bezpochyby přinesla do hudebního průmyslu revoluční změny, ať už jde o samotné generování hudby nebo nástroje pro mixování v rámci produkce. Aplikace jako Suno AI, Udio a AIVA ukazují široké možnosti, jak mohou technologie AI usnadnit a zefektivnit tvorbu hudby, přičemž uživatelům umožňují překonávat dovednostní bariéry. Na druhé straně však přináší výzvy, zejména v otázkách autorských práv.
Bibliografie
Hernandez-Olivan, C., Hernandez-Olivan, J., & Beltran, J. R. (2022, October 25). A survey on artificial intelligence for music generation: Agents, domains and perspectives. arXiv. https://arxiv.org/abs/2210.13944
Yu, D., Song, K., Lu, P., He, T., Tan, X., Ye, W., Zhang, S., & Bian, J. (2023, October 18). MusicAgent: An AI agent for music understanding and generation with large language models. arXiv. https://arxiv.org/abs/2310.11954
Vanka, S. S., Safi, M., Rolland, J.-B., & Fazekas, G. (2023, April 6). Adoption of AI technology in the music mixing workflow: An investigation. arXiv. https://arxiv.org/abs/2304.03407
Coenen, A. (1997). David Cope, Experiments in Musical Intelligence. A-R Editions, Madison, Wisconsin, USA. Vol. 12 1996. Organised Sound, 2(1), 57–60. doi:10.1017/S1355771897210101
da Silva, P. (2003). David Cope and Experiments in Musical Intelligence. Department of Computer Science, LaBRI, University of Bordeaux. Retrieved from https://dept-info.labri.fr/~mrobine/TSM/Generation/biblio/David_Cope_Da_Silva.pdf
OpenAI. (2019, 25. dubna). MuseNet. OpenAI. Získáno z https://openai.com/blog/musenet/
Tencer, Daniel (November 19, 2024). „Suno, after being sued by the majors for copyright infringement, preps launch of V4, claimed to mark ‚a new era of AI music generation'“. Music Business Worldwide. Retrieved 2024-12-05.
AIVA. (2016). AIVA : l’IA qui compose de la musique classique. Získáno z https://web.archive.org/web/20161229032623/https://iq.intel.fr/aiva-lia-qui-compose-de-la-musique-classique/
Udio. (2024). Homepage. Retrieved December 7, 2024, from https://www.udio.com/
Suno. (2024). Suno. Získáno 6. prosince 2024, z https://suno.com/
AIVA. (2024). AIVA: Your personal AI music generation assistant. Získáno 7. prosince 2024, z https://www.aiva.ai/