@ vin_roma
La cosa è molto particolare e ha dell' incredibile.
Come ha fatto You Tube in meno di un minuto a mandarmi questo:
avviso.. ai naviganti
Il fatto è questo: ho creato e caricato un mini video con uno sfondo blu fisso al solo scopo di far ascoltare 3 demo.
Non ho usato roba pubblica che potesse contenere messaggi o file accessori, erano tre mix fatti da me con dei miei lavori. All' interno del video/audio ho inserito un frammento di un mio mix con Sabrina Ferilli, mix fatto apposta per l' occasione, non conforme all' originale.
Dopo neanche un minuto in posta mi arriva il messaggio che ho citato sopra. Come hanno fatto?
Se il caricamento avviene in automatico come ha fatto YouTube a discernere la voce della Ferilli, compararla tra milioni di file protetti, riconoscerla nonostante il mix, anche come forma d' onda, poiché è completamente diverso dall' originale, inoltre non ho messo alcun nome nel titolo che facesse riferimento a lei ma solo a livello grafico come sottopancia nel video, quindi non distinguibile da un programma automatico per il quale è solo una variazione di colore...
Ma che c' è un esercito di "amanuensi" che sta lì ad aspettare che qualcuno carichi e di corsa lo confrontano e danno o meno l' Ok?
Argomento interessantissimo.
Naturalmente non si tratta di un riconoscimento bit su bit
E' la stessa teconologia di Shazam
Il file viene normalizzato per consentire il riconoscimento di diverse versioni delle canzoni (modifiche al tempo o al pitch, rumore di fondo, qualità di compressione, ...)
Il file normalizzato viene diviso in sequenze secondo alcuni criteri che non ho ancora capito
Le sequenze vengono confrontate con algoritmi che ne misurano la verosomiglianza
Il sistema non è infallibile, ma molto affidabile
Non so la potenza di calcolo richiesta, se avrò tempo continuerò l'indagine
Son partito da qui:
Youtube content identification technology?
http://stackoverflow.com/questions/649116/youtube-content-identification-technology
---
Questo molto bello: un tentativo passo passo (con esempi) di vedere fino a che punto si può ingannare il sistema di riconoscimento
Fun with YouTube's Audio Content ID System
http://www.csh.rit.edu/~parallax/
---
Wikipedia: Acoustic fingerprint
http://en.wikipedia.org/wiki/Acoustic_fingerprint
---
Questo molto approfondito con codice C
Duplicate songs detector via audio fingerprinting
http://www.codeproject.com/Articles/206507/Duplicates-detector-via-audio-fingerprinting