Intelligenza artificiale, funziona per le voci?

DjRomy 24-08-23 23.55
Salve, si parla molto di intelligenza artificiale applicata alla musica, in grado anche di far cantare cantanti passati a miglior vita.

io mi accontenterei semplicemente che mi cantasse qualche parte da corista, penso sia possibile. Ma come funziona?

Qualche delucidazione? Sono completamente a digiuno della materia.
Grazie...
DjRomy 25-08-23 23.49
Cercando in rete si trova molto
IA per creare musica

Non riesco a trovare qualcosa che crei solo il cantato, probabilmente ci sarà.. ma nessuno ci capisce qualcosa di questa nuova tecnologia?
wildcat80 26-08-23 08.00
Provati Emvoice. Ci ho fatto un paio di pezzi.
DjRomy 26-08-23 16.08
@ wildcat80
Provati Emvoice. Ci ho fatto un paio di pezzi.
Ciao Wildcat80,
ne avevamo parlato lo scorso anno e Emvoice mi fu nominato... il problema è la mancanza della lingua italiana.

Però l'anno scorsa abbiamo parlato di vst o comunque di sistemi basati su campioni.

Il mio quesito riguarda la novità dell'IA che sembra fare cose molto più complesse... non ho capito se sfrutta sempre dei campioni o un'altra tecnologia nel ricreare le voci dei cantanti e soprattutto se c'è in giro qualcosa di questa nuova tecnologia che permette di cantare piccoli incisi (in italiano nel mio caso) ...
FastHands 26-08-23 18.37
è un mondo nuovo tutto da testare e scoprire non possiamo pretendere di fare tutto da subito, a mio avviso siamo lontani ancora dal poter sfruttare la tecnologia AI .
DjRomy 26-08-23 18.49
@ FastHands
è un mondo nuovo tutto da testare e scoprire non possiamo pretendere di fare tutto da subito, a mio avviso siamo lontani ancora dal poter sfruttare la tecnologia AI .
Sicuramente c'è molto da scoprire e sviluppare.. ma ho sentito la voce di Annalisa cantare in inglese solo con IA e poi ieri stavo leggendo di Paul McCartney che vuol fare un duetto con la voce di Lennon rielaborata dall'IA.
Evidentemente ci sono già possibilità per far cantare bene una voce umana con IA,,,

Pensavo qui ne aveste già parlato, ma forse ho sbagliatoemo
DjRomy 26-08-23 23.53
Trovato questo: "È infatti possibile utilizzare strumenti come ChatGPT o il nuovo Bard di Google per generare testi ispirati a quelli di artisti famosi come Eminem, Snoop Dogg e Drake.
Questi testi vengono poi inseriti in software come Uberduck, che campiona gli audio in base ai dati vocali degli artisti selezionati.

Un ulteriore passaggio con software come Logic Pro consente la finalizzazione di un audio che, in alcuni casi, risulta quasi indistinguibile dall’originale."
Preso da qui: IA applicata alla musica

Alla base ci sono sempre dei campioni, mi sembra di capire, ma i risultati sono di un livello superiore a quello di qualsiasi vst...
DjRomy 29-08-23 00.28
Secondo me il grande caldo vi ha un po' scioltoemo.. non siete più scoppiettati come in inverno/autunno/primavera emo
Mi aspettavo delucidazioni da voi ed invece ve le darò io emo

Trovato l'applicazione IA che dovrebbe fare (incrociando le dita) quel che serve a me .. qui è spiegata bene: VIDEO MODIFICA VOCE

In pratica, mettendo un inciso cantato da me potrei scegliere una voce da donna, e dovrebbe forse venire una cosa decente... servirà un po' di tempo per capire come ottenere i risultati miglioriemo. Vi terrò aggiornati...
FastHands 29-08-23 01.22
credo che questa comunita di musicisti sia prevalentemente schierata verso il fare musica da vivo veramente e non con AI o con accrocchi da DJ. Poi direi, chi è morto lasciamolo dove sta....troverei francamente ridicolo sentire qualcosa di falsamente ricostruito. l'AI non potra mai eguagliare l'originale.
wildcat80 29-08-23 11.27
DjRomy ha scritto:
non ho capito se sfrutta sempre dei campioni o un'altra tecnologia nel ricreare le voci dei cantanti e soprattutto se c'è in giro qualcosa di questa nuova tecnologia che permette di cantare piccoli incisi (in italiano nel mio caso) ...

Emvoice usa miliardi di campioni, infatti lavora in Cloud (serve una connessione).
Riguardo la lingua, nasce inglese, ma con opportune trascrizioni fonetiche di riesce anche a farlo cantare in italiano. Non è comunque una passeggiata.
In tutta sincerità, io ci ho fatto un paio di pezzi, ma intesi come provini, poi il cantato è stato sostituito da un cantante vero e qualche frammento è stato utilizzato per armonizzare, per fare appunto dei cori, o effetti particolari tipo talkbox.
Ci sono demo abbastanza credibili, però per esperienza posso dire che occorre lavorarci su.
Una volta avevo provato a fare un lavoro inverso: ho estrapolato il MIDI file da un cantato e gliel'ho rifatto cantare, è venuta una cosa completa inascoltabile emo
toniz1 29-08-23 11.37
non so se sia la stessa cosa che intendete voi
cmq in rete si trova anche sta roba qua... che mi e' arrivata via tiktok tempo fa...

Freddy

al netto che manca un po' di "espressività"... fa paura... emo
DjRomy 29-08-23 16.40
FastHands: questa comunità usa molto i vst e questi con l'ausilio della IA saranno nettamente più evoluti, e di questo sto parlando in questo topicemo.

wildcat80: queste cose me le hai dette circa un anno fa, ma all'epoca non c'era ancora l'IA. Che i "vecchi" vst che emulano la voce usino i campioni lo so, non mi è ancora del tutto chiaro il meccanismo di questi nuovi vst IA

Toniz1: ho ascoltato il brano. Il risultato è deludente in quanto si capisce che la voce è quella della Dion un pochino avvicinata a quella di Mercury .. evidentemente all'IA non hanno spiegato che l'estensione di Mercury non poteva arrivare a suoni così acuti... forse se l'avesse trasportata una 5°o 8° sotto sarebbe venuta molto meglio. In ogni caso le potenzialità dell'IA sono evidenti, anche in questo video...
wildcat80 29-08-23 17.16
DjRomy ha scritto:
wildcat80: queste cose me le hai dette circa un anno fa, ma all'epoca non c'era ancora l'IA. Che i "vecchi" vst che emulano la voce usino i campioni lo so, non mi è ancora del tutto chiaro il meccanismo di questi nuovi vst IA


L'IA è stata sdoganata alle masse per scopi un po' così solo negli ultimi mesi, ma anche Emvoice è un plugin basato su IA. Lì il compito dell'IA è una selezione intelligente dei vari frame vocali e la loro interpolazione, basata sui fonemi del testo, sulle linee melodiche e sull'espressione.
Anche perché, è doveroso rimarcarlo, l'IA si basa su conoscenze immagazzinare e sull'attingere ad esse in maniera coerente allo scopo: l'IA di Emvoice fa esattamente le stesse cose, ha le conoscenze (i samples) da cui attingere, e li mette assieme basandosi su testo, linea melodica, abbellimenti, etc etc.
DjRomy 29-08-23 19.57
@ wildcat80
DjRomy ha scritto:
wildcat80: queste cose me le hai dette circa un anno fa, ma all'epoca non c'era ancora l'IA. Che i "vecchi" vst che emulano la voce usino i campioni lo so, non mi è ancora del tutto chiaro il meccanismo di questi nuovi vst IA


L'IA è stata sdoganata alle masse per scopi un po' così solo negli ultimi mesi, ma anche Emvoice è un plugin basato su IA. Lì il compito dell'IA è una selezione intelligente dei vari frame vocali e la loro interpolazione, basata sui fonemi del testo, sulle linee melodiche e sull'espressione.
Anche perché, è doveroso rimarcarlo, l'IA si basa su conoscenze immagazzinare e sull'attingere ad esse in maniera coerente allo scopo: l'IA di Emvoice fa esattamente le stesse cose, ha le conoscenze (i samples) da cui attingere, e li mette assieme basandosi su testo, linea melodica, abbellimenti, etc etc.
ok
DjRomy 24-10-23 00.07
Si però sentire Freddy Mercury cantare un successo di Mengoni significa che quello che cerco si puà fare: Due vite F. Mercury

Nello specifico c'è da dire che sulle note alte il risultato è pessimo, ma forse non era per estensione la canzone idonea per Freddy Mercury. Il pro è che non sembrano esserci problemi con la lingua italiana..
KBL 24-10-23 10.24
Questo è il primo link che ho trovato cercando a caso (la cosa ha incuriosito anche me).
wildcat80 24-10-23 11.09
Vocify è una porcata da puro intrattenimento trash, tanto che spopola su Tik Tok...
Oltre a Emvoice, che è quello che conosco meglio perché lo uso, ce ne sono diversi. Il miglior prodotto è probabilmente Vocaloid di Yamaha: quasi vent'anni di sviluppo, costo importante (225 euro) e aggiornamenti a pagamento. Di base c'è una dotazione di 8 voci.
Una possibilità aggiuntiva, che sinceramente non avevo considerato, sempre parlando di creazione di linee vocali armonizzanti, a costo ridotto ma un po' più indaginosa, è quella di impiegare plugin tipo autotune: in pratica, invece di sfruttare ad esempio Waves Tune come autotune, si può utilizzare per tracciare una melodia e andare a editare le singole note estrapolate creando le armonizzazioni che desideriamo.
Può sembrare un lavoretto da niente ma non lo è, perché bisogna confrontarsi con le formanti, i vibrati, i glissato trascritti come singole note...
Insomma, visto che canti tu, la cosa migliore è quella di creare le armonizzazioni registrando le singole voci: costo zero, tempo ridotto ai minimi termini.
Dallaluna69 24-10-23 12.51
@ wildcat80
Vocify è una porcata da puro intrattenimento trash, tanto che spopola su Tik Tok...
Oltre a Emvoice, che è quello che conosco meglio perché lo uso, ce ne sono diversi. Il miglior prodotto è probabilmente Vocaloid di Yamaha: quasi vent'anni di sviluppo, costo importante (225 euro) e aggiornamenti a pagamento. Di base c'è una dotazione di 8 voci.
Una possibilità aggiuntiva, che sinceramente non avevo considerato, sempre parlando di creazione di linee vocali armonizzanti, a costo ridotto ma un po' più indaginosa, è quella di impiegare plugin tipo autotune: in pratica, invece di sfruttare ad esempio Waves Tune come autotune, si può utilizzare per tracciare una melodia e andare a editare le singole note estrapolate creando le armonizzazioni che desideriamo.
Può sembrare un lavoretto da niente ma non lo è, perché bisogna confrontarsi con le formanti, i vibrati, i glissato trascritti come singole note...
Insomma, visto che canti tu, la cosa migliore è quella di creare le armonizzazioni registrando le singole voci: costo zero, tempo ridotto ai minimi termini.
Ma DJ Romano parla di un'altra cosa secondo me. Credo si riferisca al Voice Cloning. Una cosa attualmente di super tendenza. Provate ad ascoltare Barbie Girl cantata da Johnny Cash su YouTube se volete farvi un'idea (e qualche sana risata). In quel caso il risultato è eccellente. Se avete presente Johnny Cash, immaginarselo a cantare "puoi spazzolarmi i capelli, spogliarmi ovunque..." è irresistibile.
wildcat80 24-10-23 14.24
@ Dallaluna69
Ma DJ Romano parla di un'altra cosa secondo me. Credo si riferisca al Voice Cloning. Una cosa attualmente di super tendenza. Provate ad ascoltare Barbie Girl cantata da Johnny Cash su YouTube se volete farvi un'idea (e qualche sana risata). In quel caso il risultato è eccellente. Se avete presente Johnny Cash, immaginarselo a cantare "puoi spazzolarmi i capelli, spogliarmi ovunque..." è irresistibile.
No no, lui chiedeva in origine espressamente per parti da corista, poi sul cloning è stata un deriva successiva.
Dallaluna69 24-10-23 15.40
@ wildcat80
No no, lui chiedeva in origine espressamente per parti da corista, poi sul cloning è stata un deriva successiva.
Sì, ma non dice che vuole un software in grado di creare la traccia vocale da zero (come nel caso di Vocaloid) dice: "si parla molto di intelligenza artificiale applicata alla musica, in grado anche di far cantare cantanti passati a miglior vita".
Questo lo fa il vocal cloning. Anche con i cantanti tuttora in peggior vita.
Devi fornirgli la traccia vocale che vuoi trasformare. Ma visto che DJ Romano canta, questo non dovrebbe essere un problema.