TEST RUN
Tone Transfer • Magenta Studio • LALAL.AI • Uberduck • Amadeus Topline 5.2 • AIVA 2.0.49
„ Muziciranje ” uz pomoć veštačke inteligencije
Marko VASILJEVIĆ
1. decembar 2022.

Izgleda da IT industrija ne može bez hit-pojmova koji „nose” priču određen period. To, obično, bude nekakva „nova” tehnologija, nešto divlje, uzbudljivo i zvučno. Sećate se onog 3D? Sve je moralo da bude 3D, jer ako nije, onda ne valja, to je staro. Mora nekakav hype, pa još ukoliko je pojam relativno jasan, ali i dovoljno misteriozan, to je prava stvar!

Navikli smo na mašine koje brzo sabiraju i oduzimaju sumanuto velike cifre, ali da mašina „slika” i „muzicira” - to već deluje fascinantno, koliko i pomalo zastrašujuće...

Tako, već neko vreme imamo AI (Artificial Intelligence). AI ovo, AI ono. Mobilni telefoni snimaju vrhunske fotografije, ponekad bolje od onih uslikanih DSLR aparatima - uz pomoć AI-a. Tu su i filmovi o pametnim mašinama koje će pokoriti ljudsku rasu, o pametnoj mašini koja hoće svoju mamu... Međutim, u poslednjih godinu dana (možda i malo duže), kao da je nešto jači hype nego inače. Nedavno ste imali prilike i da na stranicama ove rubrike pročitate nešto više o AI „slikarima”. AI je u žiži interesovanja, a ako hoćete da budete cool i da vaš proizvod privlači poglede, negde mora da se provuče i veštačka inteligencija. Posebno ako radite na projektima u oblasti multimedije.

Navikli smo na mašine koje brzo sabiraju i oduzimaju sumanuto velike cifre, ali da mašina slika i „muzicira” - to već deluje fascinantno, koliko i pomalo zastrašujuće. Da li je došlo vreme da umetnike zameni veštački intelekt? Pa, i ne baš, ali procenite i sami...

Tone Transfer

Smatrate sebe muzikalnom osobom, ali vam je mrsko da učite da svirate na nekom instrumentu, a pritom ste sigurni u svoje vokalne sposobnosti? Dominirate u tuš kabini i nekoliko puta ste imali spontani hit koji niko, nikada nije odsvirao? Oslonite se na Google i AI rešenje pod nazivom Tone Transfer (i.sk.rs/358791, 153,75 MB).

Dolazi u formi veb-aplikacije, ali možete da ga isprobate i u obliku VST/AU plug-ina. Uprošćeno, bilo koji, a poželjno monofoni, audio-zapis biće analiziran i potom reprodukovan na nekom od ponuđenih virtuelnih instrumenata. Ukoliko imate mikrofon, otpevušite melodiju koja vam se vrzma po glavi i za nekoliko trenutaka poslušajte kako tu melodiju „svira” violina, flauta, saksofon, truba ili neki drugi instrument. U pozadini je komplikovana AI vradžbina i mašinsko učenje, tako da je moguće „utrenirati” i druge instrumente, koje će AI vešto da oponaša sa svim njihovim finim specifičnostima.

Rezultati nisu uvek idealni. Ako vaše pevanje ili neki drugi audio-zapis sadrži promene koje su nelogične za odabrani instrument, očekujte da ćete završiti sa neprijatnim zvukovima koji će vam, pritom, generisati i sasvim pristojne košmarne snove. Međutim, uz malo privikavanja na ono što je moguće i kako čitava stvar funkcioniše, skratićete sebi sate „nakucavanja” tonova u omiljenom DAW-u i dobiti skoro pa savršen sempl za dalju obradu i manipulacije. Pritom, biće koliko-toliko „odsviran” i tehnički ste malo manje varali nego inače.

AI u obzir uzima više elemenata audio-zapisa koji mu ponudite, tako da „razume” i visinu i snagu tona, a pažnju obraća i na tranzicije između tonova. Ono što Tone Transfer čini zanimljivijim od, na primer, audio-efekta ili filtera jeste mogućnost da tu informaciju „prevede” u specifičnost instrumenta na koji ga prenosi. To znači da će se neke informacije koje niste obezbedili ipak generisati, kako bi rezultat bio verniji. Vazduh koji prolazi kroz saksofon ostavlja ponešto u zvuku drugačije nego gudalo violine, na primer, i takvi detalji čine krajnji rezultat, u nekim slučajevima, jako uverljivim.

Od već „utreniranih modela”, nama se najviše dopala truba, dok violina i flauta nisu ostavile naročito upečatljiv utisak. Ipak, najveća vrednost čitavog projekta leži u činjenici da iskusnim producentima daje, potencijalno, veoma moćnu alatku za kreiranje originalnih semplova na elegantan i prirodan način, uz poneki kompromis. Mada, kako je krenulo, ne bi nas čudilo da neka naredna verzija stigne sa već „utreniranom” mašinom i podrškom za sve moguće instrumente i da sve funkcioniše „na klik”.

Pored veb-aplikacije, probali smo i plug-in, u nadi da će rezultati biti ubedljiviji, ali, zapravo, nema mnogo razlika i rezultati nisu na nivou demo snimaka koje možete da pronađete u promotivnom sadržaju. Ne kažemo da je nemoguće napraviti čudo, ali za tako nešto moraćete da se potrudite, zagrebete ispod površine i istrenirate mašinu.

Magenta Studio

Iza projekta Magenta Studio (i.sk.rs/358792, 805,13 MB) takođe stoji Google, a nastao je kao rezultat silnog eksperimentisanja sa naprednim modelima mašinskog učenja. Zapravo, reč je o pet nezavisnih segmenata različitih namena. Dostupni su kao plug-in za korišćenje u DAW rešenjima, ali mogu da se koriste i kao samostalne aplikacije.

Komponenta Generate osmišljena je kao dodatak koji od korisnika ne zahteva obezbeđivanje ulaznih informacija, već samostalno izrađuje ritam ili melodijsku deonicu. To znači da nema previše prostora za manipulaciju, već ste prepušteni algoritmu koji će izraditi onoliko varijacija na temu koliko odaberete slajderom (najviše 16). Jedinu dodatnu kontrolu predstavlja slajder „temperature”, koji, zapravo, „govori” algoritmu koliko „blesav” da bude prilikom procesa kreiranja. Najniža vrednost kreiraće prilično konzervativne rezultate, dok će maksimalna vrednost od 2.0 biti krivac za prilično neurotične budalaštine koje verovatno nikome nikada neće koristiti.

Interpolate zahteva da ga „nahranite” nekakvim sadržajem i prima MIDI zapis ritam ili melodijske deonice. AI analizira dva takva uzorka i kao rezultat nudi nov fajl koji zvuči baš kao da je inspirisan uzorima. I u ovom slučaju nemate previše manevarskog prostora - sve što možete jeste da relativno obuzdate ili razuzdate mašinu i dobijete donekle upotrebljive ili potpuno sulude rezultate.

Drumify, takođe, zahteva da obezbedite MIDI fajl, koji bi nakon analize kao rezultat trebalo da iznedri bubanj, koji će biti adekvatan melodijama i generalnom ritmu uzorka. U nekim slučajevima to će se i desiti, ali nismo sigurni koliko je rešenje osmišljeno na ovakav način potrebno i korisno, s obzirom na to da postoje daleko fleksibilniji sistemi. Na pamet nam pada Logicov ugrađeni „bubnjar”, koji, takođe, može da bude dobra osnova za krajnji beat koji tražite, a bez ulaganja previše napora. Ali, ako vam je baš bitno da sve bude pečatirano AI-jem, onda posao može da obavi i Drumify.

Kad smo već pomenuli Logic i njihovo rešenje, morali smo da napravimo poređenje i sa sledećom komponentom - Groove. Kao što naziv sugeriše, namena ovog rešenja je da MIDI zapis bubanj sekcije učini realističnijim. Da bi se to postiglo, AI je „nahranjen” satima žive svirke pravih bubnjara, ali na MIDI kontrolerima (digitalni bubnjevi). Dobijeni podaci naknadno su analizirani i „pretvoreni” u modele i pravila koja preterano precizne udarce mašine donekle mogu da „iskrive” i prošaraju nepravilnostima živih muzičara. U pitanju su sitne finese koje većina slušalaca i ne primećuje, ali upravo te sitnice mogu da vas prevare da slušate nečiji snimak, a ne kompjuter. Dobrog groovea nikad dosta, a mišljenja smo da programeri imaju još dosta da rade na programskom kôdu, kako bi nam se rezultati svideli. Logic i Garage Band su nas razmazili, pa se nismo preterano oduševili.

Na kraju, tu je i Continue, koji se trudi da MIDI uzorak koji mu ponudite produži, odnosno, da doda deonice koje bi trebalo da se uklope ritmički, melodijski i stilski. U skladu sa filozofijom ostalih delova Magenta Studia, nema previše prostora za eksperiment: možete da odaberete koliko dugačak segment treba da se kreira i koliko da bude „šašav”. I ovom prilikom, nismo ostali bez daha prilikom preslušavanja krajnjih rezultata.

Magenta Studio nije komercijalno ostvarenje izrađeno sa ciljem da se koristi kao profesionalna alatka. U pitanju je eksperiment i razvoj koncepta. Čak i takav, na samom začetku, daje naznake gde će čitava priča jednog dana otići. Za sada, producenti mogu da odahnu, neće ih zameniti, a hobisti moraju malo da sačekaju, jer sumnjamo da će uspeti da naprave bilo šta ozbiljnije upotrebljivo koristeći ovo AI rešenje.

LALAL.AI

Iza maštovitog naziva krije se još jedna AI magija (www.lalal.ai), koja je sposobna da kompleksne polifone audio-zapise analizira, razume i razdvoji na gradivne činioce. Koliko puta vam je palo na pamet da bi bilo sjajno da prilikom preslušavanja pesme možete da isključite vokal i bubanj i slušate isključivo basistu? OK, verovatno nikad, sem ako ste basista, ali razumete koncept. Ako vam je potrebna matrica za karaoke - iskoristite originalnu pesmu i izbacite vokal. Sviđa vam se neki ritam ili beat? Uzmite ga iz pesme u kojoj ste ga čuli. Sve može i sve, što je najčudnije, krajnje korektno funkcioniše u praksi.

AI uspešno prepoznaje sadržaj i omogućava da se poigrate sa pesmama, kao da imate originalne snimke razdvojene po kanalima. U čemu je problem i zašto je to muka uraditi bez ovakve asistencije? Zvučni zapis, finalni miks koji čujemo, upravo je to - miks. Svi pojedinačni instrumenti, vokali i šta sve ne, pomešani su i smućkani u jednu celinu. Iako je jasno da vokal pevača zvuči „više” od bas gitare, ne možete samo da, nekakvim ekvilajzerom, isečete frekventne opsege, jer dolazi do preklapanja frekvencija glasa, instrumentala i da ne pričamo o ritam instrumentima, koji dodatno komplikuju takve ideje. Sve i da su snimci manje kompleksni, „odlepiti” zvučne izvore koji čine zvučnu sliku mukotrpan je, a ponekad i nemoguć posao. LALAL.AI to radi bez većih muka, u roku od nekoliko minuta.

Međutim, ni on nije savršen. Prilikom testiranja probali smo sa pesmom benda Divert (Sve OK), koja je čista živa svirka, sa tvrdim miksom gde postoji mnoštvo frekventnih preklapanja i dva vokala koja pevaju paralelno. Rezultat je bio relativno dobar, ali je bilo jasno da je došlo da „krpljenja” od strane algoritma. Rešili smo da probamo i sa nešto laganijim zadatkom i pesmom benda Artan Lili (Nije svejedno), koja je i pored gitarskog zvuka dobrim delom producirana i sa sint elementima. U ovom pokušaju, matrica je ispala savršeno, dok su i izolovani vokali bili sasvim upotrebljivi za neki remix projekat. Iako će se AI bolje snalaziti sa zvukom digitalnog porekla, u određenoj meri će se izboriti i sa stvarima za koje nikada ne biste pretpostavili da je moguće.

Nažalost, ovaj komad softvera nije besplatan. Možete da ga isprobate i uverite se da li vam je ovako nešto potrebno i da li vam odgovara, ali ukoliko planirate da se igrate češće, moraćete da drešite kesu. Za profesionalce, cifra koju traže je neprimetna. Vredi!

Uberduck

Ekipa iza ovog projekta (uberduck.ai) krenula je u nešto drugačijem smeru i svoju pažnju posvetila je jednom specifičnom instrumentu, koji dolazi u nebrojeno mnogo varijacija - ljudskom glasu. Za razliku od Tone Transfera, koji pokušava da uhvati sve detalje i karakteristike pojedinačnih instrumenata, Uberduck radi isto to, ali sa bojom i izgovorom konkretnih glasova, mahom, poznatijih ličnosti i likova iz filmova i video-igara. U osnovi, ovo je text-to-speech alatka i takvih rešenja smo se nagledali i naslušali u prošlosti. Ono što do sada nismo imali prilike da vidimo jeste to da neko nudi toliko mnogo utreniranih modela koji, pritom, zvuče prilično dobro.

Donekle nas je razočaralo što tekst, koji smo sa previše optimizma uneli na srpskom jeziku, nije bio izgovoren u potpunosti tačno. Međutim, unosi na engleskom zvučali su zastrašujuće uverljivo. Ne baš kao original, ali, recimo, kao voice talent koji verno kopira uzor. Ukoliko planirate da materijal kreiran uz pomoć Uberducka koristite u komercijalne svrhe, to možete da učinite, ali uz skromnu nadoknadu.

Inače, ono što nam je posebno privuklo pažnju, a vezano je za muzičku produkciju, jeste mogućnost sintetizovanja pevanja na osnovu referentnog audio-zapisa. To znači da ukoliko uz tekst pridodate i audio-fajl sa nekom melodijom, Uberduck neće izgovarati tekst već će se potruditi da ga „otpeva”, u skladu sa muzikom u pozadini. Kao rezultat i dalje dobijate čist vokal bez muzike, koji kasnije možete da „provučete” kroz omiljeni DAW.

Ako moderna muzička scena nije vaša šoljica čaja i neobično cenite velikane 80-ih i 90-ih, Uberduck može da vam ispuni snove i poznatim glasom „otpeva” potpuno novu pesmu po zadatoj matrici. Ako niste vešti u pisanju tekstova, nema problema, AI ima rešenje i za to. Alatka nosi naziv Jarvis i pravi tekstove po uzoru na neke od afirmisanih autora, a možete čak i da joj sugerišete temu na koju da „napiše” tekst pesme. Ali, o tome drugom prilikom. Što se tiče Uberducka, možemo samo da se složimo da je ubercool.

Amadeus Topline 5.2

U napadu na zaokružena rešenja, koja omogućavaju stizanje do kompletnih muzičkih dela bez mnogo prčkanja, uhvatili smo se u koštac sa Amadeus Toplineom (i.sk.rs/358793, 600 MB). U pitanju je aplikacija za mobilne telefone pogonjene iOS-om. Oslanja se na Amadeus Code (amadeuscode.com), a ideja je da se korisnicima ponude muzičke teme koje sadrže ritam, bas i melodiju, generisane u potpunosti od strane AI-a.

Doduše, odabirom muzičkog žanra, donekle je moguće uticati na krajnji ishod, a i nakon prve varijante numere postoji mogućnost da klizačima korigujete, odnosno, navedete AI u nekom drugom pravcu. U svakom slučaju, dobijate muzičku ideju koja se sastoji od nekoliko celina, te možete da odaberete da se segment (strofa, refren) kreira ponovo bez uvođenja nove ideje.

Iz nekog razloga, ni posle višesatnog „igranja”, nijedna od ponuđenih ideja nije zvučala ni približno slično nečemu što bismo želeli da slušamo u potpunijoj formi. Jednostavno, iako tehnički „ispravno”, sve je delovalo čudno i neprijatno.

Ukoliko se kockice slože tako da, ipak, poželite da iskoristite nešto od materijala, lepo je što postoji mogućnost snimanja u formatu MIDI, koji je pogodan za dalje „igranje” i obradu. Broj instrumenata koje aplikacija nudi nije prevelik, niti zvuče kvalitetno, što „provlačenje” kroz neki DAW, gde imate dobre instrumente. može da reši u sekundi. Podržavamo ideju i neka rešenja, ali ne i kôd u pozadini. Mora tu još da se vežba, sve dok ne izađu plikovi na jagodicama.

AIVA 2.0.49

Baš kada smo počeli da stičemo utisak da je još uvek rano pričati o AI rešenjima i muzici, AIVA (www.aiva.ai, 242,95 MB) nas je donekle ohrabrila svojim simpatičnim rešenjima. U pitanju je aplikacija koju možete da koristite iz internet browsera ili kao desktop komplement. Ovo je, za sada, najbliže onome što očekujemo kada pomenemo veštačku inteligenciju i komponovanje. Dakle, ne govorimo o stvaranju loopova bubnjeva ili kratkih melodija, iz AIVE jednim klikom kreirate čitavu kompoziciju, ali, za razliku od Amadeusa, ona ovde zvuči smisleno.

Da stvari budu još lepše, ne radi se o „nabacivanju” melodije po metodi slučajnog izbora, već imate mogućnost da utičete na finalni rezultat odabirom profila koji će biti osnova za generisanje. U okviru profila postoji sijaset usmeravanja za AI, od kojih su neka apstraktna, u smislu generalne atmosfere (birate emotikon koji je veseo, tužan i slično), a postoje i konkretne smernice u smislu tonaliteta, tempa, progresije, promena i drugo. Broj dostupnih profila nije mali, jer korisnici imaju mogućnost da i sami kreiraju profile, mada se oni ne pojavljuju odmah kao dostupni, već prolaze procenu autora AIVE. Ono što je u ovom trenutku dostupno sasvim je pristojno i u roku od pola sata možete da kreirate na desetine gotovih pesama (instrumentala). Od toga, znatan procenat zvučaće odlično.

Ako i to nije dovoljno, kreirane kompozicije mogu fino da se koriguju iz ugrađenog editora. Nije u pitanju zamena za DAW, ali je blizu. Uz to je pri ruci, brz je i dovoljno fleksibilan da se obave željene korekcije. Osim „popravki” određenih nota, dodavanja novih i brisanja viškova, možete da se poigrate i sa dodavanjem ili oduzimanjem čitavih instrumenata, efekata i ostalog, što je za svaku pohvalu.

Međutim, ni tu nije kraj. Za sve one kojima je kreiranje profila nejasna rabota, potpuno nove kompozicije možete da pravite i na osnovu postojećih pesama. Dovoljno je da nađete MIDI fajl neke pesme koja vam je inspiracija i učitate je u program. AIVA će se potruditi da što bolje razume uzorak i napravi svoju varijaciju na temu. Čak možete da sugerišete i emociju koja se „gađa” u novoj verziji i tako dobijete neočekivane kreacije koje zvuče donekle poznato, a istovremeno su i potpuno nove.

Naravno, ovo nije zamena za nečiji talenat i dugogodišnje učenje muzičke teorije, međutim, za sve one kojima prethodno navedeno svakako manjka, AIVA može da bude dobra polazna osnova za dalje igranje i kreativnost.

• • •

Nakon višenedeljnog eksperimentisanja i igranja sa raznoraznim AI rešenjima, možemo da zaključimo nekoliko stvari: Velike količine podataka i mašinsko učenje fascinantan su i zastrašujuć spoj. Nakon iskustva sa AI grafičko-likovnim umetnicima, iskreno smo očekivali da i u oblasti muzičkog stvaralaštva ostanemo bez teksta. AIVA i LALAL.AI su nas, priznaćemo, prilično oduševili svojim pristupom i u pitanju su kvalitetna rešenja koja će vam pomoći da neke stvari obavite lakše i brže. Bilo da je u pitanju tehnikalija ili nedostatak inspiracije. Inače, gotovo svi projekti koje smo isprobali, a među kojima ima i svakojakih pokušaja i promašaja koje nismo ni opisali ovom prilikom, nemaju nameru da budu zamena za ljudsku kreativnost i umeće. Naprotiv, gotovo svi autori kao svrhu navode to da su osmišljeni da služe da podstaknu inspiraciju i prevazilaženje kreativnih blokada.

Moguće je da je, jednostavno, potrebno još vremena da se algoritmi razmašu i da u nekom trenutku uhvate esenciju onoga što čini neki instrumental ili pesmu. Iako se mnogo toga u muzici može izraziti numeričkim vrednostima i neminovno postoji mnogo toga što je u osnovi matematika, očigledno da postoji još nešto što je mašinama, trenutno, neuhvatljivo. To ne znači da za nekoliko godina nećemo preslušavati albume AI autora kao nešto najnormalnije.


PRETHODNI TEKST
SLEDEĆI TEKST
Najčitanije
Igre
Telefoni
Hardver
Softver
Nauka
Aktuelno štampano izdanje
FEBRUAR 2023
Gigabyte Radeon RX 7900 XTX Aorus Elite 24G
Konzervativno, a savremeno
RX 7900 XTX košta osetno manje od RTX 4080, tako da pruža više za uloženi novac...
Asus TUF RTX 4070 Ti O12G Gaming
Između dve klase
Nesuđeni „RTX 4080 12G” je ćutke i bez mnogo pompe dobio novu oznaku - RTX 4070 Ti...
CES 2023, Las Vegas, 5-8. januar
Utabanim stazama
Najveći svetski sajam potrošačke elektronike u svom 73. izdanju nastavlja starim, utabanim stazama...
Izazovi tehnoloških kompanija u 2023. godini
Osveta bezbednosti
Ove godine tehnološke kompanije neće rasti brzinom na koju smo navikli od pojave pandemije...
Dell G15 5525
Uglancani podijum za igru
Pre nešto više od godinu dana, isprobali samo Dell G15 5515 (SK 11/2021, i.sk.rs/30378), a sada nam je pod prstima njegov naslednik. Iako je na tr...
Servisi za slanje e-mail poruka
Kvalitetan poštar
Poslati e‑mail nije nikakva umetnost. No, u nekim situacijama, poslata poruka neće završiti na željenom mestu, u prijemnom folderu primaoca...
Microsoft Office: Excel za početnike
Prvih deset koraka
Uz pomoć funkcije AutoFill, unošenje suvoparnih i podataka koji se, naizgled, ponavljaju može da se automatizuje...
OnlyOffice 7.2.1
Kancelarija samo za vas
Pažnju na ovaj office paket nije nam skrenulo samo to što je besplatan, već i to što je kompatibilan sa Microsoft Officeom...
Lilygo T-Watch 2021
Otvoreni pametni sat
Od LilyGo smo dobili pravu poslasticu - pametni sat koji može da se programira po želji...
Najiščekivanije igre u 2023. godini
Kraj „posledica”?
Pregled igara od kojih se najviše očekuje tokom 2023. godine...
Forspoken
Forspoken je dovoljno dobar i relativno upotrebljiv za prevazilaženje januarskog bluza dok čekamo da stigne nešto solidnije...
„The One Ring” Tabletop RPG
Za stolom sa Tolkinom
„Svedeni” pristup ovog sistema vraća fokus tamo gde treba - na priču i igranje likova
© 2023 Svet kompjutera. Sva prava zadrzana.
Novi broj - Arhiva - Forum - O nama