Riconoscimento vocale

14 Novembre 2021

1077

Analisi della voce per stabilire lo stato di salute di una persona

Si chiama VoiceWise ed è un’applicazione di riconoscimento vocale, in particolare analisi della voce attraverso algoritmi di intelligenza artificiale (IA), messa a punto da un team di ricercatori dell’Università di Roma “Tor Vergata” che ha già dimostrato un’accuratezza del 95% nella diagnosi precoce del Parkinson ed è attualmente in uso per diagnosi e monitoraggio di altre patologie come fibrosi polmonari, tumori testa/collo, Alzheimer.

Gli algoritmi di IA consentono anche di evidenziare ogni seppur piccola (e non evidente) difficoltà nel parlato dovuta alle problematicità respiratorie, come per esempio quelle causate da virus che intaccano i polmoni, come l’ormai noto Coronavirus che ha portato al Covid-19

Takeaway

Obiettivo della ricerca: sviluppare un processo innovativo, semplice ed economico, che possa essere di ausilio al personale medico per la diagnosi precoce di una determinata malattia o disturbo, senza la necessità di sottoporre i pazienti a numerose e costose tecniche di rilevazione e diagnosi.
La voce umana è il prodotto della coordinazione di sistemi e sotto-sistemi del corpo umano ed è funzione dello stato di salute dell’individuo. Il riconoscimento vocale, o meglio l’esame del suono prodotto dalla voce è quindi un metodo nuovo di fare diagnosi successivo, parallelo e/o alternativo alla ispezione visiva o tramite strumenti.

Il riconoscimento vocale, o meglio l’analisi della voce, come strumento diagnostico per il riconoscimento precoce delle malattie e come indicatore dello stato di salute di una persona. E’ ciò a cui stanno lavorando, da diversi anni, i ricercatori dell’Università di Roma “Tor Vergata” – insieme ad altre Università e Centri di Ricerca – che hanno sviluppato un software basato su Machine Learning (ML) e algoritmi di Intelligenza Artificiale (IA) per riconoscere precocemente certi tipi di malattia.

Giovanni Saggio - Università di Roma Tor Vergata — *Prof. Giovanni Saggio, docente di Ingegneria Elettronica e ricercatore presso il Dipartimento di Elettronica dell’Università degli Studi di Roma “Tor Vergata”*

VoiceWise, questo il nome del sistema applicativo messo a punto dal Prof. Giovanni Saggio, docente di Ingegneria Elettronica e ricercatore presso il Dipartimento di Elettronica dell’Università degli Studi di Roma “Tor Vergata”, nasce dalla volontà di diversi team di Ricerca di sviluppare un processo innovativo, semplice ed economico, che possa essere di ausilio al personale medico per la diagnosi precoce di una determinata malattia o disturbo, senza la necessità di sottoporre i pazienti a numerose e costose tecniche di rilevazione e diagnosi.

L’obiettivo primario è dunque realizzare un processo di analisi della voce di un individuo per indagare sul suo stato di salute, in particolare da usare come ausilio per la diagnosi di malattie e/o disturbi, in stato embrionale quando ancora di scarsa sintomaticità, di media sintomaticità, o in stato conclamato. Tuttavia, esiste anche un obiettivo secondario, quello di realizzare un unico processo che consenta – senza alcun intervento invasivo sui pazienti – di determinare variazioni del suo stato di salute mediante il riconoscimento vocale del suono emesso dalla sua bocca.

PERCHÉ

Da dove nasce l’idea di sfruttare il riconoscimento vocale

Oggi la popolazione mondiale è esposta a numerosissime malattie, molte delle quali letali, e la diagnosi precoce è molto spesso l’unica chance per poter garantire cure efficaci.

Se malattie quali l’AIDS, le meningiti, la sclerosi multipla, il cancro, l’epatite, oppure i disturbi derivanti dalle conseguenze dell’antrace, degli attacchi di cuore, dell’aterosclerosi (in gergo non medico più spesso conosciuta come arteriosclerosi), degli enfisemi… solo per citare alcuni esempi, vengono diagnosticate in uno stato embrionale, quando ancora senza sintomaticità evidente, e/o nella prima fase della loro evoluzione, le probabilità di positivo effetto della cura aumentano significativamente.

Oggi le tecniche di rilevazione e diagnosi delle differenti malattie non mancano, tuttavia è sempre necessario chiedere ai pazienti sforzi enormi e la disponibilità a sottoporsi a numerosi esami e controlli regolari (senza contare il fatto che in taluni casi l’espressione dei sintomi può essere avvertita troppo tardi o risultare poco evidente perché le persone se ne possano accorgere).

Ecco perché il team dell’Università degli Studi di Roma “Tor Vergata” si è dedicato alla ricerca e sviluppo di un sistema diagnostico che, rispetto ai metodi tradizionali in uso oggi, potesse risultare più agile (nonché economico) – come la “semplice” analisi della voce – per supportare i medici nella diagnosi precoce riducendo l’invasività degli esami sui pazienti.

L’idea nasce da un’esigenza specifica: un collega del Prof. Saggio, in India, aveva bisogno di diagnosticare in modo economico malattie come la febbre gialla e la tubercolosi. Facendo sperimentazione in cinque ospedali in India e misurando e facendo l’analisi della voce su migliaia di pazienti, si sono raggiunti risultati così soddisfacenti da spingere il team di ricerca a brevettare il sistema e portarlo poi in Italia.

COSA

Analisi della voce come strumento diagnostico

La voce umana è il prodotto della coordinazione di sistemi e sotto-sistemi del corpo umano ed è funzione dello stato di salute dell’individuo. Il riconoscimento vocale, o meglio l’esame del suono prodotto dalla voce è quindi un metodo nuovo di fare diagnosi successivo, parallelo e/o alternativo alla ispezione visiva o tramite strumenti.

La voce è rappresentativa della condizione di determinati organi interni. Per esempio coloro affetti da una malattia polmonare, avendo una ridotta “capacità vitale” dei polmoni, spesso producono una vocalità breve ed acuta. Ciò è probabilmente dovuto alla riduzione del volume di risonanza del sistema respiratorio, ragione della maggior frequenza di risonanza della voce… che è misurabile.

La voce si compone di una molteplicità di elementi registrabili tramite una pluralità di canali audio, ognuno dei quali misurato da una pluralità di differenti parametri acustici, come la lunghezza d’onda, l’ampiezza, la frequenza, le armoniche, il tono ecc. La combinazione tra canali audio e valori dei parametri di ciascun canale dipende dalle condizioni biologiche della persona, individuate dallo stato di salute di organi specifici.

Esiste dunque una stretta correlazione tra le variazioni dei parametri della voce rispetto allo stato normale o alterato di un organo.

La voce umana ha oltre 6300 valori misurabili che possono mutare sia in modo volontario (per esempio come conseguenza di emozioni quali tristezza, rabbia, stanchezza…), e soprattutto in modo facilmente riconoscibile dall’orecchio, sia in modo involontario (per esempio a causa di malanni, disturbi e malattie) con variazioni spesso difficilmente percepibili all’orecchio (a volte anche con l’auscultazione medica).

Ciò cui sono giunti i ricercatori dell’Università di Roma “Tor Vergata” è che lo stato della salute di ognuno è determinabile dalla condizione della sua voce. Quindi, elaborando e sviluppando uno strumento di analisi della voce, i medici possono essere in grado di diagnosticare una malattia o eventuali disturbi facendo un’analisi della voce dai campioni sonori “del parlato” di un paziente.

COME

Come funziona il riconoscimento vocale di VoiceWise

Il processo di analisi della voce messo a punto dal Prof. Giovanni Saggio e dal suo team (sperimentato poi in diversi ambiti insieme ad alte Università e Centri di Ricerca) prevede l’utilizzo di algoritmi di Machine Learning ed Intelligenza artificiale per il riconoscimento vocale, in particolare per il riconoscimento e l’analisi di determinati indicatori (per esempio, 24 canali audio e 12 parametri per ciascun canale) che offrono valori numericamente così grandi da poter dare indicazioni accurate sulla relativa condizione di salute di ciascun organo interno umano e del corpo nella sua interezza.

“Questo metodo può dunque fornire un supporto valido per allertare un paziente agli stadi iniziali di una malattia, anche senza sintomaticità evidente, per aiutare a redigere diagnosi in caso di malanno conclamato ed assistere i medici”, si legge nel documento di brevetto.

Il sistema utilizza strumenti hardware (in particolare microfoni ad archetto – che rimangono vicini alla bocca delle persone anche quando si muove la testa) per registrare la voce e strumenti software per il riconoscimento vocale.

Il software, in particolare, riesce a fare l’analisi della voce grazie ad algoritmi di Machine Learning e all’utilizzo di reti neurali artificiali, comparando la voce di un paziente con quella di persone certificate sane dai medici, mettendo a confronto certi parametri (tra i quali anche sesso, fascia d’età ed etnia). Il sistema di Intelligenza Artificiale confronta i 6300 valori vocali del paziente con quelli di determinate patologie, identificando eventuali somiglianze che possono far capire (e quindi diagnosticare) la malattia di cui è affetta una persona [la diagnosi, comunque, è sempre fatta dal medico; il sistema diventa un ausilio, non un sostituto medico – nda].

Il sistema di Machine Learning auto-apprende dai dati che vengono analizzati, assicurando un continuo miglioramento delle capacità di diagnosi che nel caso del Parkinson, per esempio, sfiora il 95% di accuratezza e nel caso di disfonia arriva al 97% di accuratezza di diagnosi precoce.

APPROFONDIMENTI

Analisi della voce, le potenzialità future

Il Prof. Saggio sottolinea come un sistema simile possa essere utilizzato anche per malattie provocate da virus come il Coronavirus che ha portato al Covid-19. Tuttavia, ad oggi, non esiste ancora alcun tipo di sperimentazione a riguardo.

Oggi il team di ricerca sta concentrando gli sforzi per il riconoscimento e la diagnosi precoce di:

distrofia miotonica di tipo 1, in collaborazione con il Prof. Roberto Massa, Policlinico Tor Vergata di Roma
fibrosi polmonare ideopatica, in collaborazione con la Prof.ssa Paola Rogliani, Policlinico Tor Vergata di Roma
disturbi del sonno, in collaborazione con il Prof. Fabio Placidi, Policlinico Tor Vergata di Roma
tumori testa-collo, in collaborazione col Prof. Fabrizio Longari, Ospedale San Giovanni Battista di Foligno
Alzheimer, in collaborazione col Prof. Pedro Gomez Vilda, Universitad Polytecnica, Madrid (Spain)

Non solo, ci fa sapere in chiusura il Prof. Saggio, «con il nostro sistema possiamo assegnare un significato al tipo di pianto dei neonati. Il pianto dei neonati è diverso per cause diverse. Il pianto per fame è diverso dal pianto per desiderio di dormire, o per reflusso gastroesofageo e per dolore, ecc. Stiamo lavorando al riconoscimento automatico di ciò che i neonati vogliono comunicare attraverso il pianto, in collaborazione con la Dott.ssa Silvia Di Chio, dell’Ospedale Macedonio Melloni di Milano».

Ancora, la tosse dei bambini viene descritta di tipo “grassa”, di tipo “secca”, di tipo “stizzosa”, ecc. Tanti aggettivi significa che ogni colpo di tosse ha una sua causa specifica. «Il problema è che gli aggettivi non si correlano oggettivamente alla causa della tosse», spiega il Prof. Saggio. «Con gli algoritmi di intelligenza artificiale di VoiceWise siamo in grado di stabilire le cause specifiche per un determinato tipo di tosse; progetto che stiamo portando avanti insieme al Prof. Luca Bernardo, dell’Ospedale Fatebenefratelli di Milano».

***

NOTA:

VoiceWise è diventata una startup, spin-off dell’Università degli Studi di Roma “Tor Vergata”, e ne fanno parte:

Giovanni Saggio, Ingegnere Elettronico, con Dottorato in Microelettronica e Telecomunicazioni, che ha brevettato il “Riconoscimento di patologie attraverso l’analisi vocale”
Antonio Pisani, Medico ed Esperto Neurologo, Professore Visitatore al New York Medical College, Valhalla, NY, USA. Il 18 novembre 2019, la Fondazione Michael J. Fox Foundation ha premiato Antonio Pisani col Bachmann-Strauss Prize for Excellence in Dystonia Research
Giovanni Costantini, Ingegnere Elettronico, con Dottorato in Microelettronica e Telecomunicazioni, diplomato al Conservatorio in Pianoforte e Musica Elettronica, grande esperto di Suono
Franco Giannini, Ingegnere Elettronico, con Laurea Honoris Causa Scientiarum Technicarum dall’Università di Varsavia (Polonia), e Professore Emerito all’Università di Roma “Tor Vergata”

Membri di VoiceWise sono anche manager ed esperti commerciali, in particolare: Dr. Maria Tavasci (CEO), Ing. Fabio Pellini (Chief Technology Office), Ing. Luigi Tavolato (CEO).

Previous articleDa una “doppia pulsar” la nuova conferma della relatività di Einstein

Next articlePer la prima volta nella storia, un veicolo spaziale ha toccato il Sole