Concludiamo la nostra rassegna quotidiana nel mondo dell’intelligenza artificiale, prendendo in considerazione una news che ci giunge dai laboratori Disney Research, dove, alcuni ricercatori sono stati in grado di realizzare un software capace di suggerire un suono per ogni cosa che gli sia mostrata, indipendentemente dalla natura della stessa.
Attraverso il suo computer vision system, quindi, Disney si è spinta oltre il semplice riconoscimento di quanto è presente in un’immagine, puntando infatti ad associare alla stessa anche la componente sonora, ciò che ha fatto poi il successo del mondo del cinema e dell’entertainmente in genere: e pensare che ciò sia possibile tramite un’AI, è davvero incredibile.
Nei test condotti finora, infatti, l’intelligenza artificiale sviluppata da Disney Research è riuscita ad abbinare in maniera corretta i suoni con le immagini, per esempio fornendo il giusto rumore ad una porta in procinto di essere chiusa, o ancora, dei bicchieri durante un brindisi, come del resto, anche di alcuni veicoli in movimento sulla strada.
Se di per sé il processo di associazione tra l’audio e l’immagine possa essere abbastanza semplice per gli esseri umani, è invece interessante pensare a come sia stato possibile addestrare un computer a svolgere correttamente un compito di questa complessità , obiettivo raggiunto appunto tramite un allenamento in cui l’AI ha preso visione di una grossa selezione di video attraverso i quali è stata in grado di associare all’oggetto mostrato il suono riprodotto, riuscendo a non considerare i rumori di fondo.
Nonostante talvolta l’intelligenza artificiale dei ricercatori di Disney Research si mostri piuttosto titubante nel riconoscere alcuni oggetti – per esempio con un tram confuso con un’automobile, episodio che ha spinto l’AI a riprodurre un suono scorretto. In questo video, potete prendere nota delle potenzialità di questa AI: buona visione!