Successivo

Software

Dragon NaturallySpeaking: il computer ti ascolta

Dario Orlandi | 4 Giugno 2016

IA Software

Il riconoscimento vocale e la dettatura sono funzioni complesse e avanzate, a cui però molti utenti sono ormai abituati. Le […]

Il riconoscimento vocale e la dettatura sono funzioni complesse e avanzate, a cui però molti utenti sono ormai abituati. Le assistenti vocali come Siri e Cortana, integrate in iOS e Windows 10, o le più modeste funzioni di comando vocale offerte per esempio da Google, permettono a chiunque di trasformare la voce in un testo, che eventualmente può essere interpretato per comunicare al dispositivo in ascolto di svolgere un compito specifico.

Ma chiunque abbia provato a usare seriamente queste funzioni ha potuto notare che la precisione del riconoscimento è piuttosto bassa, e che l’interazione con i sistemi operativi soffre di limiti non trascurabili. Accanto a questi nuovi servizi sopravvive una tecnologia di dettatura più matura e avanzata, disponibile da molti anni tramite software commerciali potenti ma anche piuttosto costosi. Parliamo in particolare di Dragon NaturallySpeaking di Nuance, l’unico software di dettatura oggi disponibile sul mercato consumer. Questo suo monopolio di fatto ha forse rallentato lo sviluppo di nuove funzioni, ma la release 14, rilasciata da poche settimane anche in Italia, mostra parecchie novità  interessanti.

L'agente di trascrizione automatica di Dragon tiene sotto controllo una cartella specifica, e trasforma automaticamente in testo qualsiasi file audio copiato al suo interno

L’agente di trascrizione automatica di Dragon tiene sotto controllo una cartella specifica, e trasforma automaticamente in testo qualsiasi file audio copiato al suo interno.

La famiglia di Dragon è composta in realtà  da diversi prodotti: le versioni Home, Premium e Professional sono indirizzate al mercato degli utenti consumer, ma esistono anche edizioni specifiche pensate per i settori medico e legale. Mettiamo alla prova l’edizione Professional Individual, una nuova versione che si posiziona a metà  strada tra le precedenti Premium e Professional, e che integra quasi tutte le funzioni avanzate pensate dagli sviluppatori di Nuance. Le assenze principali riguardano alcune impostazioni di amministrazione, il roaming dei profili utente tra più computer e l’accesso tramite desktop remoto. Inoltre, la confezione retail di questa edizione non include una cuffia con microfono in bundle.

Dragon include molti comandi per muoversi all'interno del testo, apportare correzioni e modificare la formattazione. Per sfruttarli al meglio, però, serve tempo e dedizione.

Dragon include molti comandi per muoversi all’interno del testo, apportare correzioni e modificare la formattazione. Per sfruttarli al meglio, però, serve tempo e dedizione.

In un’epoca di accesso istantaneo, download brevi e ottimizzazione estrema, l’installazione di Dragon risulta un po’ anacronistica: il file scaricato da chi acquista la versione elettronica occupa oltre 3,4 Gbyte, e l’installazione richiede qualche decina di minuti tra decompressione, copia dei file e scrittura delle impostazioni. Perfino l’installer della suite Office 2016 è più compatto, e la procedura di installazione è più breve. C’è spazio per migliorare ma si tratta di un problema minore, anche perché il software risulta invece piuttosto veloce e non troppo pesante, caratteristiche non condivise da tutte le versioni precedenti. Inoltre, la lentezza dell’installazione è compensata da una fase di inizializzazione e addestramento più breve rispetto al passato: oggi basta verificare le impostazioni del microfono e leggere un brevissimo testo per completare i passaggi obbligatori. Ci sono però alcuni strumenti opzionali che vale la pena di valutare: il primo è quello che analizza i documenti contenuti nel Pc e i messaggi di posta elettronica inviati, nel tentativo di imparare lo stile di scrittura e la terminologia utilizzata dall’utente, mentre il secondo è un insieme di testi di addestramento opzionali che hanno lo scopo di migliorare il livello di comprensione del motore di riconoscimento vocale. I nostri test hanno però mostrato una precisione eccellente fin dai primi minuti, che ha di fatto reso superfluo l’addestramento opzionale. Come nelle ultime release, Dragon integra due diverse generazioni del motore di riconoscimento BestMatch (IV e V); la versione più recente richiede un processore con almeno due core e 4 Gbyte di memoria Ram, e viene selezionata automaticamente in fase di installazione se il sistema soddisfa i requisiti minimi. Dopo aver completato l’installazione e la creazione del profilo vocale dell’utente, Dragon mostra una finestra di benvenuto con una lunga sequenza di informazioni e suggerimenti.

Al primo avvio, Dragon mostra una panoramica interattiva che ne illustra le principali funzioni; un tentativo interessante di reclamizzare le funzioni meno conosciute.

Al primo avvio, Dragon mostra una panoramica interattiva che ne illustra le principali funzioni; un tentativo interessante di reclamizzare le funzioni meno conosciute.

Nuance ha infatti deciso di reclamizzare le molte funzioni svolte dal programma, probabilmente perché la maggior parte dei suoi utenti ne utilizzava soltanto una piccola parte. Il centro di controllo del software è la Dragon Bar, una barra di strumenti che da un paio di versioni è stata rivista nella forma e nell’organizzazione. La sua interfaccia è piuttosto gradevole, e occupa uno spazio minimo sullo schermo quando non è in uso, poiché si rimpicciolisce automaticamente. Le sue funzioni sono in genere piuttosto intuitive, ma sono davvero tante. Per padroneggiare Dragon serve tempo e buona volontà , anche se rispetto al passato Nuance ha migliorato la visibilità  di alcuni strumenti utili ma un po’ troppo nascosti.

Le ultime release hanno visto un deciso incremento della flessibilità  del motore di riconoscimento quando la situazione ambientale non è ideale: un tempo era necessario utilizzare una cuffia con microfono o un auricolare per poter dettare con una buona precisione. Oggi invece Dragon può garantire un riconoscimento efficace anche usando il microfono integrato nella webcam oppure nel portatile; in questi casi, però, la precisione è influenzata dalla rumorosità  ambientale. Se dovesse essere eccessiva, comunque, Dragon offre un’alternativa interessante: da qualche tempo, infatti, gli utenti di smartphone Android e iOS possono scaricare l’App gratuita Dragon Remote Microphone, che trasforma il dispositivo (e gli eventuali accessori collegati, come auricolari e cuffie) in un microfono senza fili.

La comunicazione sfrutta la connessione Lan, quindi il computer e il dispositivo mobile devono essere collegati alla stessa rete locale. Una funzione interessante introdotta da poco è Auto-Text, una sorta di espansione del testo abbinata al riconoscimento vocale. Dragon permette infatti di creare nuove “macro vocali”, veri e propri comandi che richiamano un blocco di testo di lunghezza arbitraria. Questi ritagli non sono limitati al testo puro; al contrario, possono includere anche informazioni di formattazione (grassetti, corsivi, liste puntate o numerate e così via) e perfino campi segnaposto. Per esempio, si può creare un nuovo Auto-Text denominato lettera di contatto, e poi richiamarlo pronunciandone il nome. Dragon incollerà  tutto il testo nell’applicazione aperta e poi posizionerà  il cursore sul primo campo segnaposto presente, pronto a ricevere le informazioni da inserire nei punti prescelti. Gli Auto-Text si prestano a un’ampia varietà  di usi, e possono essere legati soltanto a un’applicazione specifica per evitare interazioni indesiderate.

Un’altra novità  interessante e a lungo attesa è la funzione di trascrizione. Dragon può ora elaborare qualsiasi file audio, e fornire in output una sbobinatura automatica del contenuto, senza bisogno di creare un nuovo profilo vocale o di effettuare un addestramento specifico. L’efficacia di questa trascrizione dipende da vari fattori: dall’intensità  di rumore di fondo all’eventuale presenza di più voci che si sovrappongono. Inoltre, il testo prodotto da questa funzione è privo di punteggiatura (a meno che il dettato originale non la prevedesse), e dunque non è sempre chiaro. I possibili scenari d’uso di questa funzione sono molteplici: dalla sbobinatura delle registrazioni di lezioni o interviste, alla trascrizione degli appunti vocali. Per automatizzare ancor più la trascrizione, Dragon integra un semplice strumento che tiene sotto controllo il contenuto di una cartella specifica, ed elabora automaticamente i file audio copiati al suo interno. La trascrizione però dev’essere quasi sempre rielaborata, spesso in modo approfondito, prima di poter essere utilizzata.

In definitiva, la nuova release di Dragon NaturallySpeaking ha confermato le eccellenti prestazioni del suo motore di riconoscimento, e ha mostrato un’usabilità  superiore rispetto a qualche anno fa, in linea con le novità  introdotte nella versione precedente. Le funzioni aggiuntive sono molto interessanti, e finalmente è disponibile uno strumento di trascrizione dei file audio che, per quanto ancora imperfetto, amplia il ventaglio dei tool disponibili. Più flessibile rispetto al passato è anche la gestione delle periferiche di input: si possono usare con una discreta efficacia anche i microfoni integrati nei computer e nelle webcam, o addirittura sfruttare un dispositivo iOS o Android come microfono remoto senza fili. La versione Professional Individual rinuncia ad alcune funzioni di gestione pensate per le aziende, ma mantiene tutti gli strumenti più avanzati ed è proposta a un prezzo più basso rispetto a quello della vecchia release Professional.

Nuance Dragon Professional Individual 14

Euro 399 Iva inclusa.
L’aggiornamento dall’edizione Premium 12 o successiva costa 249 euro Iva inclusa.

PRO
Ottima precisione del riconoscimento
Trascrizione dei file audio
Funzioni di automazione avanzate

CONTRO
Installazione pesante e lunga
Alcune funzioni sono ancora un po’ nascoste

Produttore: Nuance, www.nuance.it