Iniziativa
xkl: A legacy software for detailed acoustic analysis of speech made modern
Area di intervento: INNOVAZIONE E IMPRENDITORIALITÀ ACCADEMICA
Durata dell’iniziativa: 2022
Luoghi di svolgimento: Dipartimento DIET, Sapienza e Speech Communication Group, Massachusetts Institute of Technology (MIT), Cambridge, MA, USA.
La determinazione delle proprietà fondamentali del parlato si basa su una stima fine e precisa delle proprietà temporali e spettrali dei segmenti vocali. Data la natura variabile nel tempo del discorso, una stima digitale del suo spettro istantaneo è particolarmente impegnativa ed è stata oggetto di indagine durante gli ultimi 50 anni. Il software xkl, sviluppato negli anni 80 da Dennis Klatt del Massachusetts Institute of Technology (MIT), Cambridge, MA, USA, ha capacità superiori nell affrontare il problema di cui sopra. Il suo utilizzo negli ultimi 20 anni è stato tuttavia limitato dalla mancanza di supporto per piattaforme informatiche moderne. xkl consente un livello dettagliato di analisi acustica che rivela le differenze sistematiche tra categorie fonologiche, popolazioni di parlanti e singoli parlanti, che sono sempre di più riconosciute come informazioni critiche, non solo per lo sviluppo di sistemi automatici di riconoscimento vocale ma anche per capire come parlanti e gli ascoltatori umani elaborano i segnali vocali.
Tutti i ricercatori e studenti Sapienza dedicati allo studio del segnale vocale sono beneficiari interni. La numerosità della popolazione interna può essere stimata intorno alla decina in questa fase, ma nel futuro, con lo sviluppo di nuove interfacce grafiche, sarà possibile diffondere xkl anche in laboratori di altri dipartimenti, in modo da raggiungere colleghi e studenti nel settore degli studi umanistici, in particolare linguisti, fonologi e fonetisti, psicologi.
All esterno di Sapienza, tutti i ricercatori e studenti nel campo dell’elaborazione del parlato sono beneficiari esterni. Numerosi gruppi di ricerca nel mondo sono coinvolti in ricerche di base sulla voce, circa un centinaio. È possibile quindi che xkl sia fruibile da qualche centinaia di ricercatori.
xkl è uno strumento importante che consente di mettere in evidenza proprietà del segnale che rischiano altrimenti di restare nascoste. Sono state già ricevute numerose richieste e interrogazioni sulla disponibilità e fruibilità dello strumento.
mariagabriella.dibenedetto@uniroma1.it; luca.denardis@uniroma1.it
2 ricercatori di Sapienza e 2 ricercatori di MIT
L impatto culturale dell attività potrà essere importante, dato che non esiste uno strumento come xkl. Grazie a xkl sarà possibile effettuare analisi della voce in modo molto più preciso e accurato rispetto a quanto sia possibile attualmente, e mettere in evidenza proprietà fondamentali della voce che altrimenti non vengono rivelate.
La possibile integrazione di xkl in altri software molto diffusi nella comunità, come ad esempio il software Praat, darà ulteriore forza alla diffusione di xkl.
Sarà possibile monitorare la numerosità dei gruppi che utilizzeranno xkl nei loro studi, grazie ai download di xkl. Inoltre, xkl è accompagnato e corredato da un articolo scientifico che ne documenta storia, struttura, e funzionalità.
xkl è accompagnato e corredato da un articolo scientifico che ne documenta storia, struttura, e funzionalità (https://www.sciencedirect.com/science/article/pii/S2352711023001887). L utilizzo di xkl sarà quindi anche verificato dalle citazioni ricevute per l articolo di accompagnamento, in base alle quali sarà possibile stabilire il valore scientifico ottenuto grazie all’utilizzo di xkl.