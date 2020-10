Google Sound Search ci regala un nuovo sistema di elaborazione del linguaggio naturale. L’app permette di riconoscere una canzone che viene canticchiata o fischiettata nel microfono, in maniera rapida e con un archivio ancora più esteso. Dopo la piattaforma BERT, Google sarà capace di interpretare una sempre più vasta gamma di espressioni umane.

Quando canticchiamo una melodia nella ricerca di Google, l’algoritmo AI che si occupa di apprendimento automatico o CNN, trasforma l’audio in una sequenza di numeri che rappresenta la melodia della canzone. Le azioni con cui sarà possibile identificare le canzoni sono: il canto, il fischiettio, il mormorio e le registrazioni in studio. L’algoritmo potrà riconoscere le canzoni eliminando elementi superflui come strumenti musicali di accompagnamento insieme al timbro e al tono della propria voce. Google Sound Search potrà così analizzare solamente una sequenza di numeri che rappresenta la melodia e identificarla come la canzone di cui cerchiamo il nome.

Le sequenze che registriamo vengono comparate con milioni di canzoni di tutto il mondo. L’app funziona simulando il sistema di memoria umano con cui noi riconosciamo una melodia, sia che questa provenga da una radio o dal fischiettio di una persona che passa per la strada.

Google Sound Search amplia il repertorio di canzoni

La sfida più grande, per gli sviluppatori di Sound Search, è stata quella di portare il numero di canzoni riconoscibili dalla decina di migliaia alle decine di milioni. Così però si sono moltiplicate anche le possibilità che il riconoscimento vocale potesse dare dei risultati negativi o insoddisfacenti. Per questo motivo, l’app richiede 10-15 secondi di registrazione, un tempo maggiore rispetto a quello della versione precedente, Now Playing. Tuttavia, uno degli obiettivi di Google Sound Search è stato proprio quello di essere capaci di rendere i match più veloci, così da compensare il tempo speso nella ricerca: promettono meno di 10 secondi per un risultato.

Un’applicazione pratica, più veloce e più potente

Google Sound Search è un’applicazione veloce perché si appoggia al web server, non avendo così limiti legati all’elaborazione e alla memoria dei dati. A spese del server, Google innova il sistema di riconoscimento vocale sviluppando una migliore accuratezza e una maggiore densità:

quadruplicando la taglia del network neurale di riconoscimento e delle sue parti, si riduce lo sforzo che il network stesso fa nell’impacchettare le informazioni da un formato all’altro;

duplicando la densità delle variabili nel network, si aumenteranno le categorie e la qualità del riconoscimento.

E se più volte le app di identificazione musica hanno deluso i gusti più ricercati, il team di sviluppatori di Google risponde basando l’efficacia di riconoscimento sulla popolarità della canzone. Le canzoni meno conosciute avranno infatti un sistema di identificazione più sofisticato rispetto alle canzoni più popolari. Questo significa che il database sarà ricco di canzoni sconosciute, antiche e straniere che non rallenteranno per questo il processo di riconoscimento.

Elisa Melodia