Si sono fatti strada pian piano, anno dopo anno, ora sono nelle nostre case e li diamo quasi per scontati e talvolta ci sembrano piuttosto limitati. Se però avessimo interagito con uno qualsiasi degli attuali assistenti vocali negli anni ’90 quando cominciarono ad essere disponibili sui computer casalinghi i primi sistemi di riconoscimento vocale, avremmo esultato affermando che la fantascienza più inverosimile era diventata realtà.
Assistenti vocali: da dove siamo partiti
Il primo software che consentiva di impartire semplici comandi al computer e che permetteva la dettatura di un testo con cui ho interagito fu Dragon Dictate per Windows prima e IBM Viavoice poi. Siamo agli inizi degli anni ’90 ed il concetto attuale di assistente vocale era molto lontano. Al termine della procedura di installazione era necessaria una fase di training del software. Si doveva ciò “tarare” il software in modo che adattasse il modello di riconoscimento alla nostra voce.
Dopo il training era possibile utilizzare alcuni di questi programmi per impartire semplici comandi come aprire e chiudere una finestra, salvare, ecc. Non si pronunciavano intere frasi ma sempre e solo i comandi diretti che il software era i grado di riconoscere. Per quel che riguarda la dettatura, le prime versioni richiedevano di effettuare una piccola pausa dopo ogni parola. Nelle prime dettatura facevano u po’ di errori che era possibile correggere indicando al programma la parola corretta.
Negli anni successivi sono comparsi i sistemi a riconoscimento continuo nei quali non era più necessaria la pausa tra le parole e si potevano dettare intere frasi in modo più naturale.
Riconoscimento vocale su server
I sistemi di riconoscimento vocale di cui abbiamo parlato sinora venivano eseguiti direttamente sul computer dell’utente e sono diventati via via più performanti seguendo l’aumento di potenza e di capacità di elaborazione dei computer client.
La vera svolta nei sistemi di riconoscimento vocale avviene ad opera di Google con l’introduzione di Google Voice Search prima su Android nel 2008, esteso poi ad iOS ed al browser Chrome nel 2011. In questo caso il riconoscimento vocale non viene eseguito sul dispositivo mobile o desktop dell’utente ma nei server di Google.
La disponibilità di reti veloci e di sistemi di compressione dei dati vocali efficienti fa si che l’input vocale dell’utente possa essere registrato ed inviato ai server molto velocemente. Altrettanto velocemente l’utente ottiene la risposta dal server alla sua richiesta vocale. La potenza di elaborazione disponibile su server è di gran lunga superiore a quella di un singolo client.
Il sistema di Google permette il riconoscimento di quanto detto dagli utenti senza nessuna fase di training e con buona affidabilità Nel 2010 tra le varie lingue è disponibile anche l’italiano.
Nel 2017 Google annuncia che i suoi sistemi di riconoscimento vocale hanno una percentuale di errore inferiore al 5%.
L’arrivo degli assistenti vocali
I sistemi di riconoscimento vocale di cui abbiamo parlato finora potevano integrare rudimentali sistemi per impartire semplici comandi al computer. Bisogna però attendere il 2011 per vedere la comparsa di un assistente vocale vero e proprio.
Nel 2010 Apple acquisisce infatti Siri, un assistente vocale pubblicato come app su App Store poi integrato in iOS5 rilasciato nel 2011. Per la versione in italiano bisogna attendere l’anno successivo con iOS6. In questo video la una prova con varie domande. Possiamo osservare un buon livello di comprensione anche se Siri non riconosce correttamente alcuni comandi. Si intravede anche il tentativo di dotare l’assistente vocale di un po’ di umorismo.
Nel 2015 arriva sul mercato statunitense Alexa, l’assistente vocale di Amazon. Non si tratta di un assistente associato ad uno smartphone come nel caso di Siri ma disponibile su Amazon Echo. Si tratta di un dispositivo dotato di microfono ed altoparlante da posizionare in casa ed attivabile vocalmente dicendo “Alexa”. Bisogna attendere però il 2018 per vederlo sbarcare in Italia. Amazon rende disponibili diversi modelli con prezzi molto aggressivi ed ha un grande successo in Italia.
Nel 2016 arriva anche l’assistente vocale di Google, Google Assistant, presente negli smartphone Android prima ed iOS poi (anche se ovviamente non integrato nel sistema). Google rilascia successivamente Google Home, un dispositivo simile ad Amazon Echo.
Gli odierni assistenti utilizzano sistemi di deep learning ed algoritmi di intelligenza artificiale per svolgere i compiti richiesti. In alcuni casi provano anche ad anticipare le nostre richiesti. Ancora molta strada deve essere fatta per arrivare ad avere assistenti veramente utili ed autonomi. Una cosa è certa però: se avessimo interagito con uno di loro nei primi anni ’90 avremmo gridato al miracolo.
Lascia un commento
Devi essere connesso per inviare un commento.