Tech

Cuffie AI: Cancellazione del rumore di fondo e messa a fuoco su un solo oratore con un semplice sguardo

Un’Intelligenza Artificiale per l’Udito Mirato: L’Innovazione dei Ricercatori dell’Università di Washington

Forse avrete spesso sentito l’invito “guardami quando ti parlo”.
Ma cosa succederebbe se, indossando delle cuffie, si potesse ascoltare qualcuno in maniera più chiara semplicemente guardandolo?

È esattamente quello che sta avvenendo con un nuovo sistema di intelligenza artificiale sviluppato dai ricercatori dell’Università di Washington.
Grazie a questa tecnologia, una persona che indossa cuffie con cancellazione del rumore può “registrare” una persona nel sistema semplicemente guardandola per qualche secondo.
Il sistema quindi cancella tutti gli altri rumori ambientali e riproduce solo la voce dell’oratore registrato, anche se l’ascoltatore si muove e non è più rivolto verso l’oratore.

Il sistema, chiamato “Target Speech Hearing”, è stato realizzato dalla stessa squadra che precedentemente ha sviluppato un sistema di “udito semantico” per cuffie con cancellazione del rumore.
Quest’ultima tecnologia permetteva agli ascoltatori di decidere quali suoni filtrare dall’ambiente e quali lasciar passare.
Cinguettio degli uccelli? Sì.
Urla di bambini? No.

Come Funziona il “Target Speech Hearing”

Il nuovo sistema si basa su cuffie standard dotate di microfoni.
Indossando le cuffie, la persona tocca un pulsante mentre dirige la testa verso qualcuno che sta parlando.
Le onde sonore della voce dell’oratore raggiungono i microfoni su entrambi i lati della cuffia e le cuffie inviano quel segnale a un computer integrato, dove un software di machine learning apprende i modelli vocali dell’oratore desiderato.

Il sistema si aggrappa alla voce dell’oratore e continua a riprodurla in tempo reale per l’ascoltatore, anche se la coppia si muove.
La capacità del sistema di focalizzarsi sulla voce registrata migliora con il proseguire del discorso, fornendo al sistema maggiori dati di addestramento, secondo quanto affermato dall’Università di Washington.

Confronto con Altre Tecnologie e Utilizzo in Scenari Quotidiani

Esistono già cuffie con cancellazione del rumore, come le AirPods Pro di Apple, che possono regolare automaticamente i livelli sonori durante una conversazione.
Tuttavia, il prototipo dell’Università di Washington fa un passo avanti, permettendo agli utenti di controllare chi ascoltare e quando.

Immaginate di indossare le cuffie in un ristorante affollato o in una caffetteria, dove il rumore di fondo rende difficile sentire chiaramente la persona seduta di fronte a voi.
La pressione di un pulsante e il semplice sguardo verso l’oratore cambieranno radicalmente l’esperienza.

Limitazioni Attuali e Sviluppi Futuri

Attualmente, il sistema può registrare solo un oratore alla volta e può effettuare la registrazione solo quando non esiste un’altra voce forte proveniente dalla stessa direzione della voce dell’oratore target.
Un utente può eseguire un’altra registrazione sull’oratore per migliorare la chiarezza.

Il team ha presentato le sue scoperte il 14 maggio a Honolulu durante la ACM CHI Conference on Human Factors in Computing Systems.
Il codice per il dispositivo proof-of-concept è disponibile per chi volesse svilupparlo ulteriormente.
Il sistema non è ancora disponibile commercialmente.

Guarda il sistema in azione:

%d