Forse avrete spesso sentito l’invito “guardami quando ti parlo”.
Ma cosa succederebbe se, indossando delle cuffie, si potesse ascoltare qualcuno in maniera più chiara semplicemente guardandolo?
È esattamente quello che sta avvenendo con un nuovo sistema di intelligenza artificiale sviluppato dai ricercatori dell’Università di Washington.
Grazie a questa tecnologia, una persona che indossa cuffie con cancellazione del rumore può “registrare” una persona nel sistema semplicemente guardandola per qualche secondo.
Il sistema quindi cancella tutti gli altri rumori ambientali e riproduce solo la voce dell’oratore registrato, anche se l’ascoltatore si muove e non è più rivolto verso l’oratore.
Il sistema, chiamato “Target Speech Hearing”, è stato realizzato dalla stessa squadra che precedentemente ha sviluppato un sistema di “udito semantico” per cuffie con cancellazione del rumore.
Quest’ultima tecnologia permetteva agli ascoltatori di decidere quali suoni filtrare dall’ambiente e quali lasciar passare.
Cinguettio degli uccelli? Sì.
Urla di bambini? No.
Il nuovo sistema si basa su cuffie standard dotate di microfoni.
Indossando le cuffie, la persona tocca un pulsante mentre dirige la testa verso qualcuno che sta parlando.
Le onde sonore della voce dell’oratore raggiungono i microfoni su entrambi i lati della cuffia e le cuffie inviano quel segnale a un computer integrato, dove un software di machine learning apprende i modelli vocali dell’oratore desiderato.
Il sistema si aggrappa alla voce dell’oratore e continua a riprodurla in tempo reale per l’ascoltatore, anche se la coppia si muove.
La capacità del sistema di focalizzarsi sulla voce registrata migliora con il proseguire del discorso, fornendo al sistema maggiori dati di addestramento, secondo quanto affermato dall’Università di Washington.
Esistono già cuffie con cancellazione del rumore, come le AirPods Pro di Apple, che possono regolare automaticamente i livelli sonori durante una conversazione.
Tuttavia, il prototipo dell’Università di Washington fa un passo avanti, permettendo agli utenti di controllare chi ascoltare e quando.
Immaginate di indossare le cuffie in un ristorante affollato o in una caffetteria, dove il rumore di fondo rende difficile sentire chiaramente la persona seduta di fronte a voi.
La pressione di un pulsante e il semplice sguardo verso l’oratore cambieranno radicalmente l’esperienza.
Attualmente, il sistema può registrare solo un oratore alla volta e può effettuare la registrazione solo quando non esiste un’altra voce forte proveniente dalla stessa direzione della voce dell’oratore target.
Un utente può eseguire un’altra registrazione sull’oratore per migliorare la chiarezza.
Il team ha presentato le sue scoperte il 14 maggio a Honolulu durante la ACM CHI Conference on Human Factors in Computing Systems.
Il codice per il dispositivo proof-of-concept è disponibile per chi volesse svilupparlo ulteriormente.
Il sistema non è ancora disponibile commercialmente.
Guarda il sistema in azione:
Nuova sede Echandia negli Stati Uniti Echandia, una startup svedese che produce batterie e componenti…
Introduzione Un antico detto nel settore tecnologico afferma che le aziende frequentano il loro fornitore…
Amazon presenterà i risultati finanziari giovedì, unendosi ad altri giganti tecnologici che stanno rivelando le…
This website uses cookies.