Assistente vocale: il futuro dell’interazione uomo-macchina

L’assistente vocale è una applicazione, un programma, che, installata su uno Smart Speaker o su uno smartphone Android o Apple, interagisce con noi attraverso la voce. Eseguendo comandi vocali direttamente dalla nostra voce, senza alcun bisogno di toccare il dispositivo e rispondendo vocalmente e sonoramente.

Questa pagina ha lo scopo di creare una guida sull’assistenza vocale, mettendo insieme tutti gli articoli e gli spunti presenti sul blog. Una pagina che si aggiornerà periodicamente e a cui i commenti costruttivi possono aggiungere il loro contributo.

Acquista Echo Plus (2ª generazione) – Tessuto antracite + Philips Hue White Lampadina

Una guida sull’assistenza vocale in italiano

Una guida sull’assistenza vocale in italiano è qualcosa che manca.

Ed è per questo motivo che ho deciso di iniziare a scrivere un’intera pagina sull’assistenza vocale.

Sul web

Sul web si trovano tante informazioni.

Occupandomene però mi sono reso conto che ci si confonde tra informazioni vere e proprie e informazioni commerciali. Ossia si spiega cosa sia l’assistenza vocale e nello stesso tempo o si vende qualcosa o si pubblicizza un prodotto.

Nulla di male. Anzi. Buon per chi ha qualcosa da vendere e da far comprare. Al momento, per questo blog, mi pare utile offrire ai lettori una guida che raccolga in un solo posto tutte le informazioni sparse e difficili da reperire.

Sul blog

In questo blog mi sono occupato tante volte di assistenza vocale.

Me ne sono occupato, penso e spero, in maniera avanzata, ossia, dando per scontato che tutti conoscessero cosa fosse un assistente vocale.

Mi sono occupato per esempio di problemi etici, di questione di genere. In realtà mi sono reso conto che in tanti non ne fanno uso o non ne conoscono l’esistenza. Mi piacerebbe, dunque, che se qualcuno fosse incuriosito da questo argomento trovasse appunto questa pagina e magari la condividesse sul web.

Intelligenza artificiale

Pur non occupandomi di intelligenza artificiale chi segue il blog ne ha spesso sentito parlare. In effetti, più l’intelligenza artificiale è avanzata, più il chatbot risponderà pertinentemente a quello che chiediamo.

In questo senso mi sono permesso di parlarne, o meglio, di segnalarne l’evoluzione su Mixer, la rubrica di notizie sonore.

Considerate che tutti facciamo uso di intelligenza artificiale da molti anni. Il cosiddetto T9 o correttore automatico è una forma di intelligenza artificiale. Non la più evoluta. Il T9 ci segnala sottolineando in rosso quelli che lui ritiene errori ortografici e/o grammaticali. Sui telefonini spetto sostituisce in automatica le parole che noi sbagliamo o che l’intelligenza artificiale ritiene che abbiamo sbagliato.

Spesso sbaglia anche lui. Per cui siamo tutti consapevoli della difficoltà che questa tecnologia ha nel diffondersi. Tutti comunque usiamo il correttore.

Guida sull’assistenza vocale in italiano

Quello che mi prefiggo di fare con questa guida è quello di mettere insieme tutto quello che si trova sul web ed esprimere le mie opinioni a riguardo.

Il blog, purtroppo, non ha ancora la sostenibilità per disporre di tutti gli assistenti vocali e testarli. Per forza di cose userò risorse esterne, puntando sull’autorevolezza degli autori e sulla veridicità delle informazioni .

Mi farebbe, però, davvero piacere, ospitare anche le vostre prove, le vostre esperienze e condividere una pagina che possa essere utile al web e ad altri utenti.

Cos’è, come funziona, cosa posso fare con un assistente vocale

Un assistente vocale è un software di intelligenza artificiale progettato per interagire con gli utenti tramite il riconoscimento vocale e rispondere alle loro richieste vocali. Gli assistenti vocali sono integrati in dispositivi come smartphone, smart speaker, smartwatch e altri dispositivi IoT, e utilizzano il machine learning e l’elaborazione del linguaggio naturale per comprendere e rispondere alle richieste degli utenti.

Per funzionare, gli assistenti vocali utilizzano il riconoscimento vocale per interpretare la voce dell’utente e trasformarla in un testo scritto, che viene poi elaborato dal software di intelligenza artificiale per capire l’intenzione dell’utente. In seguito, l’assistente vocale può fornire informazioni, eseguire attività o avviare altre app per soddisfare la richiesta dell’utente.

Tra le attività che è possibile fare con un assistente vocale ci sono:

  • Chiedere informazioni: gli assistenti vocali possono fornire informazioni su una vasta gamma di argomenti, come il meteo, la musica, il traffico, i risultati sportivi, la ricerca su internet e altro ancora.
  • Gestire gli appuntamenti: è possibile utilizzare un assistente vocale per programmare appuntamenti, impostare promemoria, e gestire il proprio calendario.
  • Controllare i dispositivi domestici intelligenti: gli assistenti vocali possono essere utilizzati per controllare i dispositivi domestici intelligenti, come le luci, il termostato, i televisori, e altri dispositivi connessi alla rete.
  • Eseguire attività specifiche: gli assistenti vocali possono essere utilizzati per eseguire attività specifiche, come inviare messaggi, fare chiamate, scrivere e-mail, e altro ancora.
  • Fare acquisti: alcuni assistenti vocali consentono di fare acquisti online, ordinando cibo, vestiti, e altri prodotti.

In sintesi, gli assistenti vocali sono diventati un modo comune per interagire con i dispositivi tecnologici, semplificando e velocizzando molte attività quotidiane.

Origine dell’assistenza vocale

In principio c’erano i bot abbreviazione di robot dove però manca la meccanica. Il primo a immaginare questa tecnologia, negli anni ’50, fu Alan Turing, matematico e visionario, a cui dobbiamo il cosiddetto test di Turing. Un test che ci fa capire se una macchina sta pensando.

Il primo bot che le masse hanno usato, però, si chiamava Clippy, la graffetta di Microsoft Office che quando aprivi uno dei programmi Office 2007 ti bussava sullo schermo e ti chiedeva se ti poteva aiutare. Ebbe poca fortuna. Più che altro era un fastidio doverlo chiudere ogni volta.

I bot sono programmi che fanno qualcosa al posto dell’uomo. Fanno cose semplice o cose molto complicate. Ma sono ripetitivi.

I bot che svolgono operazioni di analisi e che parlano sono chiamati Chatbot.

Cos’è un assistente vocale

L’assistente vocale è una applicazione che, in genere, non necessita di funzionare attraverso uno schermo, o il tocco sullo schermo. Ma si aziona tramite un comando vocale. A seconda di che assistente parliamo, lo Smart speaker ho ospita l’assistente vocale si aziona tramite le parole, Alexa, Ok Google, Hey Siri, oppure Cortana.

Basta pronunciare la parola di accensione e l’assistente vocale ci ascolta.

Si tratta, insomma, di applicazioni che parlano.

Generalmente l’Assistente vocale è personalizzabile, affidandosi ai motori di ricerca, risponde o cerca di rispondere alle domande dell’utente, eseguendo alcuni compiti, notifica eventi, etc.

La grande sfida dell’assistenza vocale è l’utilizzo del linguaggio naturale per rispondere alle domande, trovare informazioni, lanciare applicazioni e connetterti con vari servizi web.

Acquista Nuovo Ring Video Doorbell | Videocitofono con video in HD a 1080p, rilevazione avanzata del movimento e facile installazione (Seconda Generazione)

Cosa fa un assistente vocale

Ricorda, comprende, memorizza comandi ripetitivi, parla la tua lingua, è multilingue, di sicuro parla in inglese, tedesco, spagnolo, francese, giapponese; ma anche italiano, coreano, portoghese, russo e cinese. Le altre lingue soffrono un po’.

Alcune case di produzione come Apple, Microsoft e Amazon hanno il loro assistente vocale, rispettivamente si chiamano Siri, Cortana e Alexa. Altri assistenti vocali invece si possono istallare su smartphone, tablet o computer portatili.

Alcuni assistenti vocali imparano quello che tu gli insegni. Ossia lo puoi programmare a rispondere in un dato modo ad un determinato comando.

Ti presentiamo Blink Mini – Videocamera di sicurezza intelligente per interni, plug-in, compatta, con video in HD a 1080p, rilevazione di movimento, compatibile con Alexa – 1 videocamera

Controlla ogni cosa con la tua voce

Ho raccolto in un unico articolo Controlla ogni cosa con la tua voce alcuni articoli dedicati a Google, Alexa, Cortana e Siri.

Inoltre potrebbero interessarti

I migliori assistenti vocali

Al momento non esiste un assistente vocale migliore di un altro. Nel senso che sono tutti in fase di sviluppo. E se magari google Home ha maggiore sviluppo nella traduzione di testi, Alexa è più avanti come skills e capacità di risposta.

L’assistente vocale migliore è l’assistente che ti fa interagire meglio con il tuo ecosistema di riferimento.

Mi spiego. Se sei un appassionato ed hai tutti gli accessori Apple? Allora Siri, farà al caso tuo per chiedere ricerche e far attivare azioni varie.

Sei un cliente compulsivo di Amazon e sei un cliente Prime? Alexa è imbattibile!

Non tradirai mai android e Google è il tuo super eroe? Google assistant e Google Home per sempre!

Non hai mai fatto a meno di Windows? Cortana, sebbene lo sviluppo si è un po’ arenato, sarà il tuo assistente vocale da lavoro.

Cos’è Google Now Google Assistente vocale

Google Now Google Assistant sfrutta le capacità di Google e quindi fa principalmente ricerca vocale.

Google Now Google Assistant fornisce un modello semplice per gli sviluppatori per aggiungere azioni personalizzate che possono essere attivate tramite comandi vocali. Simile a Microsoft, Google sta iniziando a integrare le interfacce di conversazione-

Google Now Google Assistant beneficia dei contributi della comunità di sviluppatori Android e grazie al suo Google Home è in rapida crescita.

Aggiornamento marzo 2018

Google Assistant, l’assistente vocale google è arrivato in Italia. Maggiori informazioni le trovi negli articoli dedicati.

Cos’è Siri

Siri di Apple è l’unica ad avere una sua personalità ed è la più naturale di tutte le assistenze vocali.

Siri è, al momento, l’interfaccia conversazionale più utilizzata nel mercato. Anche se Apple non ha aperto completamente Siri come una piattaforma, ci sono diverse interfacce di programmazione che sono disponibili tramite tecnologie come HomeKit di Apple.

Nella pagina ufficiale si legge cosa può fare per te Siri.

Mandare un messaggio, telefonare, trovare un ristorante, sapere se pioverà o fare testa o croce. Mentre guidi puoi chiedere qual è l’itinerario migliore e l’ora di arrivo prevista, senza staccare gli occhi dalla strada e le mani dal volante. E Siri funziona con HomeKit, perciò ti basta usare la voce per controllare la domotica di casa. Siri sa sempre che succede nel mondo, e per rispondere alle tue domande cerca su Wikipedia, Yelp, Shazam e altri servizi online. Più usi Siri, più ti accorgi di quante cose sa. E quante cose sa fare per te.

Ti presentiamo Echo Show 8 – Resta sempre in contatto con l’aiuto di Alexa – Tessuto antracite

Cos’è Cortana

Cortana, secondo quanto dichiarato dalla stessa Microsoft, è impegnata ad aiutare l’utente ad essere più produttivo.

Cortana di Microsoft ha sviluppato la capacità conversazionale in molti modi che sono disponibili per gli sviluppatori mobili tramite gli strumenti di sviluppo di Windows 10.

Le interfacce di conversazione forniti da Cortana stanno diventando una caratteristica comune dei prodotti di Microsoft, e le interfacce di sviluppo sono adottate dalla comunità degli sviluppatori Microsoft.

Cosa posso fare con Cortana

Non ci può essere una pagina o un sito migliore della pagina ufficiale del produttore che spieghi cosa si può fare con il proprio assistente vocale.

Ecco alcune cose che Cortana può fare per te:

  • Visualizzare promemoria in base a data/ora, luoghi o persone.
  • Monitorare pacchi, squadre, interessi e voli.
  • Inviare e-mail e SMS.
  • Gestire il tuo calendario e mantenerti aggiornato.
  • Creare e gestire elenchi.
  • Chiacchierare e giocare.
  • Trovare dati, file, luoghi e info.
  • Aprire qualsiasi app nel tuo sistema.

Acquista Echo Flex – Controlla i dispositivi per Casa Intelligente con comandi vocali grazie ad Alexa

Cos’è Alexa

Alexa di Amazon, che tra gli assistenti vocali è l’unico senza uno schermo, si propone di fornire le migliori risposte per ascoltare musica, leggere un libro audio, fornire notizie, vedere il saldo del conto bancario Capital One, e chiamare una macchina Uber.

Amazon ha rilasciato il kit di Alexa per il servizio vocale che consente agli sviluppatori di aggiungere nuove capacità o competenze per consentire interazioni vocali nelle applicazioni.

Cosa posso fare con Alexa?

Ho scritto un intero articolo riguardo a cosa posso chiedere ad Alexa. E continuato con lo spiegare le Skills Amazon Alexa.

Acquista i dispositivi con Alexa

Bixby. Assistenza vocale Samsung

Bixby a detta della Samsung stessa è un modo nuovo di usare il Galaxy S8 o S8+. Bixby è molto di più di assistente vocale. Si tratta infatti di un sistema integrato di intelligenza artificiale. Le persone che hanno acquistato questo smartphone possono parlare, scrivere e inquadrare la propria vita e chiedere qualunque cosa.

Bixby comprende e cercherà in tutto i modi di risolvere le domande che vengono rivolte.

Quando non trovi le parole, usa la fotocamera e Bixby cercherà per te. Con una sua intelligenza artificiale, Bixby impara anche le abitudini.

Al momento, anche in italia, Bixby parla in inglese.

Assistente vocale Smart TV Samsung

Le Smart Tv Samsung serie H hanno tra le loro funzionalità la guida vocale. La guida vocale samsung è principalmente pensata per le persone disabili con difficoltà visive.

Per attivare e utilizzare la guida sono necessarie alcune impostazione che qui presento in breve. L’assistenza vocale si trova andando su

Sistema > Accessibilità > Guida vocale

Da qui attivare su ON

Poi è possibile anche stabile che genere di voce preferiamo per cui si va su

Sistema > Controllo vocale > Voce televisione

E da qui modificare il genere.

Una volta attivata l’assistenza vocale si disattiva automaticamente il sensore di movimento. O si ha uno o l’altro.

L’assistenza vocale può essere utilizzata per cambiare canale, aumentare o diminuire il volume e gestire le funzioni del televisore.

È possibile anche modificare le impostazioni dell’assistenza vocale stessa. Il volume dipenderà dalle impostazioni del volume del televisore. Però possono essere modificati anche la velocità del parlato, il tono e il livello di descrizione.

Cos’è IBM Watson

IBM Watson è la piattaforma più avanzata di cognitive computing presente sul mercato. Le funzionalità di interfaccia di conversazione di questo assistente vocale sono a disposizione degli sviluppatori attraverso il Developer Watson Cloud.

Cos’è VIV

Viv è una piattaforma di intelligenza artificiale (AI), che offre agli sviluppatori e produttori di hardware la capacità di fondere qualsiasi prodotto o interfaccia con un’interfaccia utente conversazionale (UI).

Assistente vocale Microsoft 10

Avviare o interrompere l’Assistente vocale
Puoi attivare o disattivare l’Assistente vocale in tre modi:

In Windows 10 Creators Update, premi il tasto WINDOWS + CTRL + INVIO sulla tastiera. Nelle versioni precedenti di Windows 10, premi tasto WINDOWS + INVIO.
Nella schermata di accesso seleziona il pulsante Accessibilità nell’angolo in basso a destra e scegli Assistente vocale.
Vai a Impostazioni > Accessibilità > Assistente vocale, e sposta il dispositivo di scorrimento in Assistente vocale.

Assistenza vocale di terze parti

Acquista Echo Auto – Porta Alexa in auto con te

Hound

Non è molto conosciuta. Come altri assistenti vocali risponde a varie domande.  Si attiva dicendo “Ok Hound“. E la sua velocità di risposta dipende dalla velocità di connessione.

Jarvis

Ispirato all’assistenza vocale di Iron Man funziona su Android Wear. Invia messaggi, avvia chiamate telefoniche. Può modificare le impostazioni del dispositivo.

Smart speaker

Questi assistenti vocali oggi stanno aprendo un nuovo mercato che è quello degli smart speaker. Ossia delle casse acustiche che possono rispondere attraverso comandi vocali.

Qual è il miglior assistente vocale?

Qual è il miglior assistente vocale? E il miglior assistente vocale per Android?  La risposta è dipende. Dipende da cosa ci devi fare. Qui di seguito aggiungerò tutte le comparazioni che vengono fatte con l’aggiunta dei miei commenti.

Google Assistant VS Siri

PhoneArena ha svolto 4 test mettendo a confronto Google Assistant contro Siri. Hanno dato i risultati attraverso delle infografiche.

Il vincitore è Google Assistant, anche se Siri si è dimostrato più integrato con i propri servizi made in Apple.

(continua…)

La pagina si aggiornerà nel tempo per dare le migliori informazione sul tema.

Analisi dal blog sull’assistenza vocale

Assistenti vocali in espansione

Assistenza vocale una questione di genere

Perché tutti i gadget vogliono parlare

Nuovo Echo Dot Altoparlante intelligente con Alexa

da Toni Fontana | Mar 29, 2021 | 

Il nuovo echo dot, di 4 generazione, aggiunge Alexa a qualsiasi stanza.

Si tratta dello smart speaker più venduto, al momento, che cambiato il suo design da piccolo cilindro a sfera e che a detta di Amazon

si adatta perfettamente anche a un ambiente ristretto e, grazie alle voci nitide e ai bassi bilanciati, offre un suono ricco in tutta la casa.

Musica maestro!

“Alexa, metti della musica dappertutto.”

Usando la voce si può chiedere di ascoltare un brano, un artista o un genere musicale. Di base, se hai Amazon Prime, si ha la possibilità di ascoltare molti brani musicali, ma non tutto.

Se si vuole qualsiasi musica è necessario abbonarsi ad Amazon Music, Apple Music, Spotify, Deezer, oppure ad altri servizi a pagamento.

Con Musica multistanza puoi ascoltare in tutta la casa musica, stazioni radio, podcast e contenuti Audible da più dispositivi Echo compatibili in varie stanze.

Echo dot in tutta la casa

Rispetto all’Amazon Echo, al cetro della casa, il dot è sempre stato pensato e di fatto usato, come un satellite. Uno per ogni stanza.

Amazon sostiene che rende la tua vita di ciascuno più semplice.

In realtà, non basta volere un assistente vocale e giocarci. Ci vuole anche modificare certe abitudini di vita e inserire l’assistente vocale nella tua quotidianità. Non è così ovvio come si può pensare.

  • Imposta un timer,
  • fai domande,
  • aggiungi articoli alle tue liste
  • inserisci un evento
  • inserisci un promemoria in calendario.
  • ascolta le ultime notizie,
  • ascolta le previsioni del tempo
  • ricevi le informazioni sul traffico,

È possibile accedere a migliaia di Skill Alexa, come SuperGuidaTv o Fitbit.

Controlla la tua casa con comandi vocali

Lo abbiamo può volte ripetuto. Controlla ogni cosa con la tua voce.

Se possedessi un Echo dot in ogni stanza, puoi gestire i dispositivi integrati per avere una casa Intelligente da controllare usando la tua voce.

Accendere la luce del comodino prima di alzarti dal letto, abbassare le luci per guardare un film senza alzarti dal divano o spegnere il termostato prima di uscire. sarà molto facile e immediato.

In casa tutti in comunicazione

Grazie alla funzione Drop In è possibile chiamare gli altri dispositivi in una determinata stanza. Con questa funzione è possibile fare un annuncio, urbis et domui.

Ad esempio, se hai casa grande e non vuoi gridare ai quattro venti, puoi far sapere che la cena è pronta; oppure puoi ricordare ai bambini che è l’ora di andare a dormire.

Progettati per tutelare la tua privacy

Amazon continua a ripetere che Alexa e i dispositivi Echo sono stati progettati con diversi elementi di protezione della privacy.

E mette in evidenza il fatto che sui dispositivi Echo si trova un pulsante che disattiva i microfoni, rendendo di fatto il dispositivo inutilizzabile.

Mentre a molti piacerebbe poter usufruire di questa privacy magari continuando, almeno, ad ascoltare musica.

Sul blog a riguardo abbiamo più volte scritto. Se ti interessa…

Ad ogni modo, Amazon tenta di migliorare e rassicurare le persone dando la possibilità di gestire le tue registrazioni vocali che possono essere lette, ascoltate o eliminate, in qualsiasi momento, attraverso l’applicazione o chiedendo allo smart speaker di eliminare tutte le conversazioni della giornata.

Ti potrebbe interessare

Il sito assistenza vocale per la casa.

L’UX frena l’assistenza vocale?

È possibile che UX e assistenza vocale, in questo momento, facciano a pugni? Che l’UX freni l’assistenza vocale? È possibile che il più grande ostacolo all’uso degli assistenti vocali e delle interfacce conversazionali sia proprio l’user experience, l’esperienza d’uso? Proprio l’assistenza vocale che ha come obiettivo quello di allargare il bacino di utenza a tutti per la facilità d’uso, in realtà pone degli ostacoli al suo uso quotidiano? E dunque potrebbe essere questo il motivo per cui alcuni miei colleghi guardano con diffidenza agli assistenti vocali e al mio blog? È questa la ragione di un certo scetticismo?

L’esperienza delle persone non è ancora ottimale. O, come sono personalmente convinto, l’esperienza e l’uso non rispecchiano le aspettative. Ma il lancio dello smartspeaker Google Home e del software Google Assistant hanno tracciato una via che durerà più di quanto si possa prevedere.

Il blog è nato proprio per parlare di queste cose ed essere consapevoli. Ed è per questo che ripercorro con voi l’articolo di Rebecca Sentance, con le mie riflessioni personali.

Le prime parole di Siri

Se si esegue una ricerca vocale in inglese, “Quando è stato lanciato Siri?” Google rimanda all’introduzione che ne da Wikipedia:

Siri è l’assistente digitale sviluppato dalla Apple Inc. presente nei dispositivi iOS, macOS, watchOS e tvOS, quali iPhone, iPad, Mac, Apple Watch e Apple TV.

In italia, invece, Google Assistant rimanda ai vari link e parla solo se si chiede “Cos’è Siri?”.

Siri, l’assistente vocale di Apple, come sappiamo è nata con il lancio dell’iPhone 4S nell’ottobre 2011.

Da allora si è cominciato a parlare di comandi vocali non più come fantascienza ma come vera e propria realtà. Solo da qualche anno a questa parte se ne parla più frequentemente. Si veda la nascita di questo blog. E posso testimoniare che rispetto ai miei esordi, nel 2015, il numero di articoli presenti, sul web, sul tema sono sempre più numerosi.

Nel campo della ricerca, poi, la ricerca vocale è indicata come una delle principali tendenze che daranno forma all’industria, nell’immediato prossimo futuro.

Chi usa l’assistenza vocale?

Ma quanti di voi stanno utilizzando realmente e quotidianamente l’assistenza vocale? Chi risponde positivamente, probabilmente sarà una minoranza. Soprattutto si tratta di “addetti ai lavori.” Tra questi molti scettici che stressano il sistema, lo mettono in difficoltà l’assistenza vocale e tendono giustamente ad evidenziare, anche giustamente, i difetti.

Poi ci saranno anche tanti “makers” che smanettano su ogni novità tecnologica e questi sono coloro che diffonderanno davvero questa tecnologia tra le persone.

La maggior parte ci avrà giocato forse qualche minuto, per vedere l’effetto che fa e poi ha abbandonato la diavoleria che risponde solo ad una certa tonalità e ad un certo modo di dire “Ok Google” in perfetto american slang. E non vi sembri strano che la pronuncia corretta di Google sia tra le competenze di una minoranza di persone.

Senza dover disturbare i sondaggi, il fatto che si vedono, nel 2018, persone alla guida che usano il proprio smartphone usando vista e tatto, significa che neppure siamo arrivati al vivavoce. Altro che assistenza vocale.

Se Google fosse una persona?

Ma cosa accadrebbe se Google fosse una persona reale? È quello che si è immaginato in una memorabile webserie, di qualche anno fa, dal titolo “If Google Was a Guy”.https://www.youtube.com/embed/yJD1Iwy5lUY?feature=oembed

In uno spezzone una ragazza chiede quanto sia grande il Serengeti. Per la cronaca “La pianura di Serengeti è una regione di circa trentamila chilometri quadrati, costituita da prateria, savana e boschi situata in Africa orientale”.

Al quale l’assistenza vocale, non riconoscendo la pronuncia corretta, in inglese, confonde Serengeti con spaghetti. Il che fa infuriare la ragazza.

Il video vuole far ridere e ci riesce. Ma nella vita reale un errore di questo genere non fa ridere. Anzi. Porta la persona ad arrabbiarsi sul serio e ad abbandonare l’uso degli assistenti vocali.

Nonostante il potenziale rivoluzionario dell’interfaccia vocale, l’esperienza dell’utente, la user experience non è ancora al massimo della forma.

Conversazioni comiche o frustranti?

Bisogna assolutamente dire che gli assistenti vocali hanno fatto passi da gigante in termini di accuratezza del riconoscimento vocale negli ultimi anni. Le intelligenze artificiali di Google e Microsoft si avvicinano al 95% di riconoscimento. Che è poi il livello umano. Anche noi ci perdiamo il 5 percento delle conversazioni e compensiamo con altre capacità.

Le interfacce vocali sono progettate per imitare le conversazioni umane e così, quando conversiamo con un assistente vocale, si entra in un contesto che, fino ad oggi, è stato esclusivamente umano. Un contesto che è completamente diverso rispetto a quando ci mettiamo davanti ad un “disumano” schermo.

Forse un romano della Roma Antica comprenderebbe meglio un assistente vocale rispetto a noi. Per i Romani di allora la parola non era un’esclusiva umana, nel senso ampio che abbiamo oggi. Per gli antichi romani gli schiavi, per esempio, erano strumenti parlanti, per nulla paragonabili ad un essere umano. Definiti appunto Res vivente, (res significa, in latino, cosa) Anche i barbari erano coloro che balbettavano parole insensate e molto più vicini ad animali, appunto, che ad essere umani.

Forse, a ben pensare, noi ascoltiamo e trattiamo questi avanzati assistenti vocali con lo stesso disprezzo.

Aspettative molto alte

Lo dicevo due anni fa al WIAD Palermo 2017. I nostri punti di riferimento per l’assistenza vocale sono film di fantascienza e fumetti. Il nostro immaginario ha aspettative tanto alte quanto irreali rispetto alle capacità di questa tecnologia. Eppure più queste conversazioni migliorano, più ci aspettiamo che gli assistenti vocali digitali si comportino come umani. E quando per una qualche ragione non ci capiscono, subito ce ne allontaniamo.

Come se poi fosse stato naturale iniziare nuovi lavori stando davanti ad uno schermo. Cosa che ancora non tutti sono in grado di fare. Come se l’uso di PC fosse davvero così diffuso da permeare la totalità dell’Umanità. Per chi oggi fa uso quotidiano di questi strumenti, ricordo che sono passati decenni dal primo contatto con un computer dove la maggior parte delle persone ha iniziato a giocare. Nel tempo abbiamo imparato a farci altro, oggi sappiamo, grosso modo, cosa possono fare e come funzionano. E come rispondono.

Portare l’interazione all’interno del nostro mondo conversazionale (che ripeto ancora è un mondo complesso) significa cambiare completamente prospettiva. All’improvviso entrano in gioco una serie di aspettative completamente nuove. Vogliamo e pensiamo che i nostri assistenti vocali pensino, rispondano e ragionino come gli umani e l’esperienza dell’utente è prevedibilmente insufficiente.

Tocca all’architettura dell’informazione conversazionale colmare questo vuoto, come immagino stia accadendo oltreoceano. Insieme ad una moltitudine di professionalità che ruotano intorno all’assistenza vocale, tra figure più tecniche e figure prettamente umanistiche.

Un giorno vivremo come nel film HER e ci ritroveremo a parlare con i nostri assistenti vocali. Ma se dai romani ad oggi sono passati 2000 anni, da Google Assistant ad Her ne passerà del tempo. Non dico altri duemila anni, ma qualche decennio sicuramente.

Scelta e contesto

I problemi sono tanti e diversi. Le interfacce vocali danno l’illusione dell’interazione umana. Illusione, straordinaria, potente, ma pur sempre un’illusione.

Per far funzionare gli assistenti vocali le persone devono pronunciare esattamente le parole e i comandi giusti. E queste parole non sempre sono intuitive. Non solo. Ma gli assistenti vocali non mantengono sempre il contesto di conversazione come facciamo noi, per esempio, con il principio di cooperazione Grice.

Al momento le migliori interazioni sono limitate agli acquisti. Ecco perché il grande successo di Amazon Echo. I passi successivi ad un dialogo, invece, non sono soddisfacenti. Ecco perché tutti gli altri inseguono.

La semplicità non garantisce necessariamente l’usabilità e la mancanza di funzionalità disponibili può essere spesso più frustrante che utile. Nel momento in cui gli utenti non riescono a ottenere facilmente ciò di cui hanno bisogno con un’interfaccia, gli assistenti vocali verranno disattivati, indipendentemente da quanto efficientemente consentano loro di riordinare gli asciugamani di carta.

Fiducia dell’utente vincente

Ma la sfida più importante è quella di ottenere e mantenere la fiducia delle persone che fanno uso di questa tecnologia.

Nelle giuste circostanze, l’interazione vocale uomo-macchina è uno strumento molto utile. Purtroppo bastano un paio di esperienze negative per far mettere da parte, per sempre, le interfacce vocali.

Lo stesso Greg Hart, vicepresidente di Amazon, responsabile di Echo e Alexa, ha dichiarato che

la creazione di un assistente vocale in grado di rispondere a ogni possibile query è un problema davvero difficile.

Forse è qui che, nel 2011, Apple ha sbagliato. Ha sbagliato nell’invitare le persone a chiedere qualsiasi cosa a Siri. Forse già dalla sua nascita Siri era destinata a fallire.

Oggi sappiamo, per certo, che i comandi vocali funzionano meglio con vincoli specifici e ristretti. Le nostre aspettative sono ancora alte ma gli sviluppatori pongono dei freni proprio per riconquistare la fiducia degli utenti.

Per non parlare poi del suono della voce, le nostre pronunce, gli aspetti di fisica acustica, pongono degli ostacoli all’esperienza d’uso.

Come distruggere i tuoi dati vocali dall’assistente vocale

Sul sito dedicato puoi trovare le indicazioni su come distruggere i tuoi dati vocali.

UX e assistenza vocale – Conclusioni

Sebbene in questi giorni stia usando Google Assistant e già ho amici che hanno acquistato i primi interruttori ad interfaccia vocale, io stesso non ho messo tra le mie priorità l’uso dell’assistenza vocale. Non sempre ho il piacere di ripetere più volte “ok Google” per non arrivare a quello che mi aspetto di trovare.

Ogni volta che una persona rinuncia ad usare l’assistenza vocale è un fallimento. Certo. Ma questi fallimenti frenano non fermano.

Oggi, mentre la discussione è ferma a quanto bene o male funzionino, a quanto pericolosi possano essere, si sta aprendo un mercato enorme di oggetti parlanti.

In un modo o nell’altro presto avremo nelle nostre case questi oggetti della domotica e impareremo ad usarli.

Personalmente, piuttosto che giudicare i fallimenti, sono felice di partecipare a questo tempo. E resto a guardare tra l’incuriosito e il meravigliato. Sono felice di poter vedere i primi passi (diciamo quelli più consistenti) di questa tecnologia che mi affascina. E persino gli errori mi fanno tenerezza. Poter partecipare con il mio blog, a questa trasformazione, per me è una soddisfazione che supera persino la gioia di sapervi miei lettori.

Con i miei articoli spero solo di poter dialogare e conversare con altri essere umani sul tema. E intanto, grazie sempre di essere arrivato fin qui.

Assistenti vocali sul mercato

Gli assistenti vocali sul mercato fanno, grosso modo, tutti la stessa cosa. Ma Siri, Google, Cortana e Alexa, con alle spalle le relative aziende, hanno profili diversi:

  • Google Now sfrutta le capacità di Google e quindi fa prettamente ricerca.
  • Siri di Apple è l’unica ad avere una sua personalità ed è la più naturale di tutte le assistenze vocali.
  • Cortana, secondo quanto dichiarato dalla stessa Microsoft, è impegnata ad aiutare l’utente ad essere più produttivo.
  • Alexa di Amazon, che tra gli assistenti vocali è l’unico senza uno schermo, si propone di fornire le migliori risposte per ascoltare musica, leggere un libro audio, fornire notizie, vedere il saldo del conto bancario Capital One, e chiamare una macchina Uber.

Alexa, assistente vocale che è integrata con Echo, è vista da tutti con molta attenzione perché è di proprietà di Amazon. Un progetto nato quasi per scherzo, dal punto di vista progettuale molto indietro rispetto agli avversari, ma proprio perché si tratta di Amazon, ha una impronta molto più commerciale e invasiva degli altri.

Mentre Google, Apple e Microsoft, infatti, stanno allargando e chiudendo i loro ecosistemi, Amazon è già da tempo un ecosistema chiuso, con i suoi utenti felici di stare al suo interno. Google, Apple e Microsoft se vogliono vendere qualcosa devono fare accordi con altri per vendere questo qualcosa. Amazon, al contrario, il proprio ecosistema ce lo ha già, i clienti già spendono e sanno come spendere i propri soldi all’interno dello Store con fiducia immensa.

Nei prossimi mesi tutte le grandi aziende di tecnologia tenteranno, in tutti i modi, di tenerci al loro interno. Per capire questa tendenza basta pensare agli Instant Article di Facebook. Il loro scopo non è quello di tenerci informati, ma quello di tenerci più a lungo dentro le pagine Facebook e non uscire dalla piattaforma. Più tempo noi, come utenti, trascorriamo su Facebook, più facilmente siamo vendibili a chi produce pubblicità.

Se da un lato dunque si tenta di migliorare l’esperienza utente all’interno delle piattaforme, spingendo gli utenti a fare l’interesse delle piattaforme, dall’altro lato l’assistente vocale sarà la ciliegina sulla torta.

Aparna Chennapragada, la direttrice di prodotto di Google, dice che,

Una delle cose che stiamo cercando di capire è, come far rimanere questo assistente con l’utente. Il che significa a casa, in macchina, a lavoro, ma anche in vacanza, ovunque lui (l’utente) vada.

L’assistenza vocale sarà dunque la nostra compagna; ci ascolterà e risponderà al meglio alle nostre esigenze. In realtà soddisferà le esigenze dei loro produttori. Con buona pace della nostra privacy.