Le interfacce conversazionali sono quel mezzo di interazione, tramite dispositivi di input e output, che consente di eseguire comandi vocali, o immettere dati, mediante programmi di riconoscimento vocale. Se ne parla da anni. Più di recente, e soprattutto durante la fine del 2015 e il 2016, si è potuto notare un maggiore interesse verso questo tema.

Il blog tra presente e futuro

Chi segue il blog, ormai, ha familiarizzato con il concetto di interfaccia e assistenza vocale. Me ne sono già occupato:

Chi si occupa di innovazione tecnologica si pone, sempre più spesso, la stessa domanda. In futuro, come parleremo alla nostra tecnologia?

Sviluppo delle interfacce conversazionali

Chi osserva il fenomeno converge su un fatto.

Lo sviluppo di nuove interfacce, tra le quali le interfacce vocali, è in evoluzione ed è oggetto di grandi investimenti da parte dei produttori tecnologici. Obiettivo di tutti è essere protagonisti della prossima rivoluzione delle interfacce: una rivoluzione che trasformerà l’interazione uomo-macchina da grafico/tattile a sonora/vocale e quindi modificherà le esperienze digitali (ma forse non solo digitali) di tutti gli utenti. La rivoluzione, anche se lenta e con evoluzioni al momento auspicabili, sarà profonda perché eliminerà il bisogno di usare e apprendere linguaggi e sistemi di comunicazione diversi dal nostro parlato o dalla nostra lingua.

Interfacce conversazionali per aziende

L’interesse non riguarda solo gli utenti (consumer). Le aziende, che utilizzano applicazioni e interfacce, guardano con interesse ai sistemi di produzioni collaborativi. A tal proposito raccolgo e ripropongo l’opinione di Jesus Rodriguez. Rodriguez è Managing Partner di Tellago e consulente per aziende come Microsoft e Oracle. Rodriguez è molto ottimista e allarga il discorso sull’utilità delle interfacce conversazionali per le aziende. Conferma inoltre l’interesse che si mostra verso questa rinnovata tecnologia.

Diciamo rinnovata. Le interfacce conversazionali, vocali, di messaggistica, invisibili, infatti, non sono nate ieri. Sono anni che se ne parla e che i ricercatori fanno sperimentazione. Oggi un assistente vocale come Cortana, Siri, Alexa e altri, non sarà perfetto, ma ciascuno è utilizzato da milioni di utenti. Ciascun assistente vocale aiuta a fare tante cose; in modo sempre più veloce e sempre più preciso.

Perché adesso?

Le speranze e le aspettative sono cresciute. Proprio adesso. Perché, rispetto a poco tempo fa, fondamentalmente sono cambiate due cose.

  • La prima è la quantità di dati di cui disponiamo (e la possibilità di elaborare e analizzare questi dati).
  • La seconda è la possibilità di avere questi dati anche sul nostro dispositivo mobile. Dispositivo che è connesso ad una rete, 24 ore su 24 e con applicazioni alla portata di tutti.

Jesus Rodriguez sostiene che, sebbene le interfacce di conversazione non siano ancora adottate in azienda in maniera significativa, questa tendenza, almeno dal suo osservatorio, sta per cambiare.

Le capacità e il rapido progresso delle interfacce di conversazione sono destinate a diventare uno dei mattoni fondamentali della prossima generazione di applicazioni aziendali.

Le caratteristiche fondamentali delle interfacce di conversazione in azienda saranno basati sulla fornitura di meccanismi, senza soluzione di continuità, per interagire con i sistemi aziendali e utilizzare i comandi vocali. In azienda le interfacce di conversazione possono essere viste come un’estensione dell’user experience fornita dalle applicazioni mobili. Questa semplice estensione apre le porte a nuovi scenari che erano incredibilmente difficili, o semplicemente impossibili, da risolvere senza modelli di conversazione.

Interazioni conversazionali

Le interfacce conversazionali stanno diventando un altro elemento della user experience in applicazioni mobili.  Un elemento dominante l’esperienza degli utenti che fanno uso dell’Internet delle cose, in casa come in azienda.

Uno dei grandi vantaggi dell’interazione vocale in azienda è l’esperienza di conversazione.

Mentre le interazioni degli utenti di applicazioni mobili sono costretti a ciò che è previsto sui diversi schermi, le interfacce di conversazione offrono un modello, a tempo indeterminato, per interagire con i sistemi aziendali ponendo domande o dettando azioni tramite comandi vocali. La natura conversazionale delle interfacce vocali offre agli utenti aziendali un modello di interazione senza essere vincolati da una interfaccia utente specifica.

Interazioni multi-utente

Le applicazioni mobili aziendali sono progettati per le singole interazioni con l’utente.

Le interfacce di conversazione rompono questo confine, permettendo a diversi utenti di interagire con una sola applicazione al fine di realizzare un compito specifico. Questa capacità consente livelli di collaborazione in azienda e nell’Internet delle cose che erano impossibili prima.

Le interfacce di conversazione consentiranno la realizzazione di aziende moderne e la possibilità di interagire con l’internet delle cose attraverso app a comandi vocali. Questi modelli creeranno un canale diretto tra gli utenti business e la linea dei sistemi aziendali senza i vincoli di una specifica interfaccia utente. Proprio come i servizi web o API, le interfacce di conversazione sono destinate a diventare un nuovo modello di integrazione per sistemi aziendali.

Internazionalizzazione e complessità tecnologica

Internazionalizzazione e soluzioni per l’internet delle cose richiedono uno sforzo tecnologico non indifferente. Fattori come il supporto perle diverse lingue o le differenze culturali nella user experience rendono difficile lo sviluppo delle applicazioni mobili. Ma nessuno si arrende.

Le interfacce conversazionali offrono un semplice modello di internazionalizzazione. La maggior parte delle interfacce cognitive supportano efficacemente lingue diverse e modelli di conversazione.

Negli ultimi anni, il campo delle interfacce conversazionali è diventato uno dei campi più concorrenziali e innovativi del settore mobile. Di conseguenza, l’industria ha prodotto molte piattaforme tecnologiche. Queste piattaforme sfruttano il cognitive computing per fornire interfacce di conversazione sempre più sofisticate.

Interfacce conversazionali

Mentre alcune piattaforme hanno il potenziale per guidare l’adozione di interfacce conversazionali in azienda, il mercato sta vedendo molta innovazione nelle nuove start-up e nei fornitori di telecomunicazioni.

Questo livello di concorrenza potrebbe rendere le interfacce conversazionali una delle funzionalità più importanti della prossima generazione di app mobile e dell’Internet delle cose, in azienda.

Tanti sono ancora gli scettici su queste tecnologie. Ma è innegabile che la tecnologia mobile stia modificando la nostra società. Alcuni paradgmi si stanno rovesciando. Avere gli strumenti per analizzare e osservare questi nuovi fenomeni lo ritengo essenziale.

Il mio punto di vista sulle interfacce conversazionali

Ancora oggi, nonostante i passi avanti di chatbot e assistenti vocali, e nonostante la diffusione in tutto il mondo, molte persone continuano a criticare le interfacce conversazionali, come fallimentari.

Come spesso ho raccontato su questo blog, il mio interesse è un interesse di studio. Ho sempre amato gli ambienti sonori, ho trascorso momenti importanti della mia vita dentro una radio locale, poi sono diventato il resposnabile di una web radio universitaria. Insomma, l’audio è diventato nel tempo il mio mondo.

Grazie a questo blog, grazie ai consigli raccolti, grazie ai lettori (senza la quale non ci sarebbe nessuna spinta a scrivere) ho potuto approfondire varie declinazioni, fino ad arrivare alle interfacce vocali.

Un fondo di verità

È capitato a tutti di interagire con una interfaccia vocale, e non riuscire a concludere nulla. Dunque alcune critiche sono in parte vere.

Ma la mia reazione a questi risultati è diametralmente opposta rispetto ai detrattori. Quando, infatti, un chatbot fallisce, la mia reazione non è… “Ecco, lo vedi? Ha fallito. Se fosse stata una interfaccia grafica, a quest’ora avremmo concluso!”

La mia reazione è quella di chiedermi perché. Perché ha fallito? Cosa è andato storto? Il dispositivo non ha compreso la mia voce o proprio non ha una risposta? Come potrebbe essere risolto il problema?

Amico dei chatbot

Chatbot e interfacce vocali hanno dei problemi?

Il mio impegno è capire come superare questi problemi. Io ho raccolto l’invito di Morville ad essere amico dei chatbot.

È per questo motivo, per esempio, che il mio corso si basa sulla progettazione.

Sono fermamente convinto che uno dei problemi delle interfacce vocali, se non “Il Problema” sia che lo sviluppo dei chatbot sia del tutto affidato agli strumenti. In altre parole, i chatbot sono chatbot centrici. A domanda rispondono e dunque funzionano. Dimenticando e tralasciando la parte di progettazione e la centralità dell’uomo rispetto al funzionamento.

In molti, certamente in prima linea i miei haters, sostengono che ci sono troppi problemi e che altre saranno le soluzioni e dato che non possiamo prevedere il futuro è inutile impegnarsi in questo studio.

Un trend inarrestabile

Otto anni di blogging dimostrano, a mio modesto parere, che non mi trovano per nulla d’accordo. Io non ho previsto il futuro. Ma in questi anni Amazon ha continuato a sfornare dispositivi con Alexa integrati.

Ed oggi, siamo a chatgpt che è solo un pezzo di disegni ancora più grandi.

Non c’era da prevedere il futuro, bastava notare la spinta enorme verso l’espansione di questi dispositivi.

Ma che sia chiaro, io non evito di affrontare le critiche, e forse anche per questo il mio punto di vista risulta perdente. Il mio atteggiamento è laico, guardo con ottimismo alle interfacce vocali, ai modelli linguistici, ma non ho nessun interesse che prevalgano su altri touchpoint.

Sono convinto che anche in un futuro pieno di interfacce vocali, si tratterà di soluzioni alternative e non esclusive.

Una maggioranza visiva

Chi critica aspramente le interfacce vocali preferisce nel proprio quotidiano altri canali di relazioni, come il visivo e il cinestetico.

Come ho spesso detto, se i video ricevono tanto successo lo sono perché la stragrande maggioranza della popolazione si relazione al mondo in modo visivo.

Ovvio che l’essere umano non è solo visivo, solo acustico o esclusivamente cinestesico, ma abbiamo una prevalenza.

Progettazione conversazionale

Ad ogni modo, una via molto promettente che sto seguendo è la progettazione conversazionale.

Le interfacce conversazionali spingono i brand a conversare, ad avere dialoghi con i propri clienti, così come i clienti vogliono conversare direttamente con le aziende. Sembra una cosa facile, ovvia. ma non lo è.

L’Importanza e le limitazioni dell’Interfaccia Vocale

Il dibattito sulla voce come tecnologia rivoluzionaria o una mera distrazione tecnologica è in corso. Tuttavia, la realtà è più sottile: ora abbiamo a disposizione una nuova interfaccia di input/output e il compito principale per i progettisti e i produttori di prodotti è di capire quando e come utilizzarla al meglio.

Fase di transizione della tecnologia vocale

L’introduzione di assistenti vocali come Alexa, Siri, Cortana e “Ok Google” non segnala l’arrivo definitivo della tecnologia vocale. Piuttosto, indica l’inizio di una nuova fase di sviluppo in cui la tecnologia vocale viene implementata in casi d’uso reali.

Percorso dell’innovazione

Ogni nuova tecnologia significativa deve attraversare un “naso lungo” di innovazione. Bill Buxton, principale ricercatore presso Microsoft Research, afferma che una tecnologia richiede circa 30 anni per passare dal “progetto di ricerca” alla piena maturità. Quindi, la tecnologia vocale non sostituirà immediatamente tutte le altre forme di input, ma piuttosto si sovrapporrà ad esse.

La sovrapposizione delle nuove tecnologie

Le nuove tecnologie non eliminano quelle vecchie, ma si sovrappongono. Ad esempio, l’introduzione della voce non ha cancellato l’uso dei touchscreen, così come i touchscreen non hanno eliminato l’uso del mouse. Le interfacce sono intrinsecamente multimodali e ogni nuova tecnologia trova la sua nicchia e si espande gradualmente.

Il concetto di Place-ona

Bill Buxton ha introdotto il concetto di “place-ona”, che descrive come la posizione di un utente può limitare il tipo di interazioni possibili con un dispositivo. Non esiste un “miglior input” o un “miglior output” universale. Questo dipende in gran parte dal contesto dell’utente, il che determina quali interfacce sono disponibili e appropriate.

Il ruolo della voce nell’interazione con l’utente

In base ai vari scenari di interazione con l’utente, è evidente che l’interfaccia utente vocale ha un ruolo significativo in alcuni contesti. Tuttavia, la voce non è sempre l’opzione ottimale.

La voce come input imperfetto

Sebbene la voce possa essere un mezzo di input efficace in alcuni scenari, ha anche le sue limitazioni. La velocità e l’accuratezza della voce sono spesso inferiori rispetto ad altre forme di interazione, e l’ascolto può essere più lento della lettura.

Il futuro della voce

Infine, quanto grande potrà essere l’interfaccia vocale? Questa è una domanda complessa e dipende da molti fattori. Le tecnologie odierne hanno ancora delle limitazioni, ma l’interfaccia vocale ha sicuramente un grande potenziale che dobbiamo ancora sfruttare pienamente.

La voce nei messaggi

L’uso della voce nei messaggi rappresenta una svolta, normalizzando l’idea che le persone parlino ai loro dispositivi per controllarli. Questo è uno scenario in cui l’interfaccia vocale può davvero eccellere.

La voce come interfaccia

In conclusione, anche se la voce non è una piattaforma o un nuovo paradigma dell’interfaccia utente, è comunque una nuova interfaccia che dobbiamo progettare e implementare. Altrimenti, rischiamo di sembrare come coloro che una volta criticavano l’uso del mouse.

Design dell’interfaccia vocale

Un approfondimento sulle pratiche attuali

La progettazione conversazionale e la conferma delle informazioni

Nel campo del design conversazionale, il modo migliore per confermare le informazioni pronunciate e per gestire le aspettative degli utenti è un tema fondamentale. Dobbiamo capire se il sistema dovrebbe avere uno stile di controllo del comandante o adottare un tono più conversazionale. Questo diventa particolarmente rilevante quando si progetta l’interfaccia utente vocale (VUI) per le app mobili o i dispositivi, considerando che si prevede un aumento dell’interazione vocale tra l’utente e il sistema.

Sistemi di risposta vocale interattiva

All’inizio del 2000, i sistemi di risposta vocale interattiva (IVR) diventavano sempre più comuni. Questi sistemi erano spesso usati dalle aziende come un mezzo di gestire le richieste dei clienti. Tuttavia, questi primi sistemi erano limitati nella loro capacità di fornire informazioni dettagliate e spesso finivano per trasferire l’utente a un operatore umano.

L’evoluzione dei sistemi di risposta vocale

Con il passare del tempo, i sistemi IVR hanno visto una significativa evoluzione. Molte aziende hanno iniziato ad utilizzare l’IVR come prima linea di interazione con i clienti, raccogliendo informazioni di base e completando attività semplici come la prenotazione di un volo. Inoltre, queste nuove generazioni di sistemi IVR sono state efficaci nel reindirizzare i clienti alla risorsa giusta, risparmiando tempo all’utente e all’azienda.

Dispositivi mobili e sistemi di interfaccia vocale

Mentre alcune strategie di design IVR possono essere applicate al design dell’interfaccia utente vocale per dispositivi mobili, quest’ultima richiede un approccio più complesso e variegato. Per esempio, i dispositivi mobili utilizzano spesso interfacce multimodali, permettendo agli utenti di interagire sia vocalmente che tramite uno schermo.

Utilizzo di interfacce multimodali

Prendiamo ad esempio una richiesta a Google su chi sono le persone più ricche del mondo. Mentre Google può elencare le persone e le loro fortune, presentare queste informazioni sotto forma di una lista visiva risulta essere un’esperienza molto più coinvolgente per l’utente. Ecco perché sfruttare le capacità visive del dispositivo mobile è fondamentale per creare un’esperienza ricca.

L’importanza della coordinazione tra Designers e VUI

Se stai progettando un’interfaccia multimodale, come un’app di videogiochi per dispositivi mobili, è importante che il design dell’interfaccia e l’interfaccia vocale lavorino in sinergia. Entrambi dovrebbero essere considerati come due componenti della stessa conversazione che l’utente sta avendo con il sistema.

Sistemi IVR vs Interfacce Vocali su app e dispositivi Mobili

Infine, una differenza chiave tra i sistemi IVR e le interfacce vocali su app o dispositivi mobili è che quest’ultime sono spesso utilizzate per attività una tantum. Ad esempio, si potrebbe chiedere a Cortana di impostare una sveglia o a Google quale sia l’animale terrestre più veloce. Queste sono interazioni brevi, dove il sistema non deve mantenere molte informazioni. Questa particolarità dovrebbe essere presa in considerazione quando si progetta un’interfaccia vocale per dispositivi mobili, rendendo la conversazione il più fluida possibile.

In conclusione, progettare un’interfaccia vocale efficiente richiede una riflessione accurata sulla natura del dispositivo, sull’interazione utente-sistema e sulla specificità del contesto in cui viene utilizzato.

Come le interfacce vocali parlano al futuro del business

A che punto sono le interfacce vocali per il business? Non molto tempo fa ho elencato i settori che saranno modificati dall’assistenza vocale. Chi si occupa di sviluppo di software aziendali sta ovviamente volgendo la propria attenzione alle interfacce conversazionali o vocali. Ed è ovvio che questo venga fatto, dato che si parla di soldi e di affari. Ormai si cerca di integrare in ogni dove l’assistenza vocale.

Da Siri a Cortana, da Alexa a Google Assistant, stiamo tutti dando ordini ai nostri dispositivi.

Controlla ogni cosa con la tua voce

Secondo la società di ricerca di eMarketer, si prevede che il numero di americani che utilizzano un dispositivo con assistente vocale crescerà, già da quest’anno del 129%. Arrivando a 36 milioni di persone.

Ti presentiamo Echo Flex – Controlla i dispositivi per Casa Intelligente con comandi vocali grazie ad Alexa.

Velocità dell’interazione e facilità d’uso

La tecnologia dell’interfaccia vocale sta diventando rapidamente pervasiva, dalle auto autonome, ai frigoriferi parlati e ai mobili parlanti, insomma, alla domotica.

Le grandi aziende stanno già collaborando per rendere le interfacce vocali multi-piattaforma.

Microsoft e Amazon stanno formando una partnership per integrare meglio Cortana e Alexa. Mentre già Amazon è in collaborazione con Logitech, il che significa che puoi utilizzare Alexa in qualsiasi Ford, Volkswagen o Volvo.

Certo, non tutte le aziende vogliono collaborare con quelle grandi. Alcuni desiderano mantenere un controllo sulle interazioni con i clienti. Cisco, per esempio, non vuole cedere alla collaborazione; e lavora a Cisco Spark Assistant. E Cisco non è la sola.

Le assunzioni basate sulle competenze. In America

Molte aziende americane, soprattutto quelle del mondo del lusso, stanno premendo l’acceleratore. Usano gli assistenti vocali e investono in questa tecnologia. Per cui, da un lato offrono un servizio tecnologicamente avanzato ai loro clienti, e dall’altro lato gestiscono meglio i loro magazzini.

Ma ci sono anche altri esempi. Pensiamo, per esempio, a tutti noi che abbiamo una assicurazione. Magari l’assistente vocale può avvisare che l’assicurazione sta per scadere ed offrire un rinnovo a prezzi vantaggiosi.

Tutto questo richiede da parte delle aziende assunzioni di personale competente e consapevole.

Questo per dire che le interfacce vocali per il business influenzeranno anche il mondo del lavoro.

C’è ancora tanta diffidenza

Il problema è che c’è ancora tanta diffidenza. Così come già esposto anche la scorsa settimana su Chatbot e assistenti intelligenti a lavoro. Molte persone ancora percepiscono l’assistenza vocale poco sicura. Diciamo dal lato etico e della privacy, voi sapete come la penso. E ancora dal lato tecnico progettuale ci sono dei limiti. La mancanza di contesto e persino il rumore di fondo possono interferire con i comandi vocali.

Interfacce vocali per il business

Precisione

Il “tasso di errore delle parole” è al centro della ricerca. IBM, Microsoft e Google spendono denaro e ricerca per migliorarlo. Statisticamente Google ha un tasso di errore di parola di quasi il 5%. Che poi è anche il tasso di errore umano, volendo. Solo che noi arricchiamo la conversazione con molti altri elementi.

E nonostante tutto stanno migliorando questo tasso di errore per portarlo a zero. O quasi zero.

Risparmio di tempo

La polizia canadese sta beneficiando dell’interfaccia vocale, riducendo il tempo impiegato per la registrazione dei rapporti, ridotto, a quasi l’85%. Stessa cosa per i paramedici che vengono liberati dalle loro tastiere anche con la tecnologia dell’interfaccia vocale.

È un vantaggio per la vendita al dettaglio

Mettiamo che stai acquistando un jeans e non riesci a trovare la tua taglia. Con la tecnologia dell’interfaccia vocale a portata di mano, i dipendenti potrebbero chiedere all’assistente vocale dove si trova e persino ordinare per i clienti i loro jeans preferiti.

Nel mondo che verrà ci sarà la pubblicità?

C’è una domanda che in pochi si stanno ponendo. Che fine farà la pubblicità?  Almeno quella che siamo abituati a vedere negli schermi con i banner. A parte il fatto che pochissimi cliccano i banner, se non per sbaglio, probabilmente cambierà il modo di fare pubblicità.

Ci sarà la possibilità che l’assistenza vocale possa comunicare silenziosamente attraverso i display (sugli annunci di autobus, nei centri commerciali, ecc.). Potrebbero far comparire un annuncio in base alla cronologia degli acquisti recenti o a quello che indossi in quel preciso momento.

E sì, questo costringerà i marchi a creare modi migliori e più intelligenti per fare pubblicità. E con annunci più intelligenti, i consumatori si troveranno più disposti a spendere soldi, rendendolo un vantaggio per tutti. O no?

Buon futuro a tutti!

Le interfacce vocali sono la nuova sfida dell’usabilità

C’era un tempo in cui MS-DOS, con la sua interfaccia a riga di comando (CLI), rappresentava un incomprensibile buco nero per l’usabilità. L’interazione con il tuo computer richiedeva una conoscenza pregressa del sistema e del suo linguaggio. Questo livello intimidatorio di astrazione ha raggiunto rapidamente i suoi limiti, cedendo il posto alla rivoluzione delle interfacce grafiche (GUI), che ha reso le informazioni accessibili, comprensibili e utilizzabili attraverso icone, menu e finestre. Senza GUI, l’informatica non avrebbe mai raggiunto un’ampia diffusione.

Le interfacce utente conversazionali (CUI) sono state spesso paragonate alle CLI. Entrambe prevedono che la comunicazione tra uomo e macchina avvenga tramite richieste imperative da parte dell’utente, un modello fondamentale dell’interazione uomo-macchina. Mentre la CLI richiede agli utenti una chiara definizione dell’obiettivo e un sapere come esprimere le proprie richieste nel linguaggio della macchina, la filosofia alla base delle CUI mira a simulare un dialogo e ad utilizzare il Processing del Linguaggio Naturale (PLN) per decifrare il linguaggio umano. Capire le intenzioni dell’utente rimane una delle sfide più ardue dell’Intelligenza Artificiale.

Tuttavia, non è l’IA in sé a suscitare le mie critiche. Il mio punto di vista critico riguarda la trasposizione di comportamenti e processi complessi in un formato conversazionale e le implicazioni negative di questa scelta progettuale per l’utente.

Nel corso della mia analisi, ho trovato che molte delle mie perplessità erano state affrontate nel recente studio del Nielsen Norman Group sugli assistenti intelligenti che utilizzano CUI. Questo rapporto sottolinea che “assistere agli utenti che faticano con le interfacce AI è stato come tornare agli oscuri anni ’70: la necessità di memorizzare comandi arcani, modalità soffocanti, contenuti confusi, interazioni rigide – fondamentalmente un’esperienza utente sgradevole”.

Le interfacce vocali: un amore controvoglia per il marketing?

L’industria del marketing ha adottato le interfacce utente conversazionali (CUI) con entusiasmo. Analogamente a quanto avvenuto con le app, le CUI catturano l’attenzione dell’utente e aumentano le metriche misurabili, come la durata della sessione utente su Google Analytics. Ma ciò non sempre coincide con un’usabilità ottimale: passare più tempo su un’app o una funzione non indica necessariamente un’efficienza superiore. Ancora ironicamente, le CUI potrebbero rendere più ardue attività semplici, come spiegherò a breve.

Esaminiamo e smitizziamo alcuni dei presunti vantaggi delle CUI per l’esperienza utente, come descritto in un articolo dal titolo “UI del futuro: interfacce conversazionali”:

  1. “Sembra più naturale delle app” e “Modo di interazione più naturale”: non sempre un modo di comunicazione “naturale” risulta efficiente per interagire con una macchina, soprattutto se si tratta di svolgere un compito “innaturale”, come effettuare un bonifico bancario. Molti dei nostri rapporti con le macchine sono piuttosto “innaturali”, eppure per questi abbiamo sviluppato soluzioni efficaci.
  2. “Non è necessario acquisire nuove competenze per interagire con un’interfaccia”: dovrebbe essere questo l’obiettivo finale di qualsiasi app consumer, indipendentemente dalla forma che la sua interfaccia assume.
  3. “Permette la personalizzazione”: in realtà, praticamente qualsiasi cosa può essere personalizzata.
  4. “Non è necessario scaricare un’app mobile separata”: è un vantaggio, ma non esclusivo dei chatbot e non compensa i problemi di usabilità.
  5. “Nessun giudizio”: su questo punto sono d’accordo, ma questa è una caratteristica generale delle macchine, non specifica delle CUI.
  6. “Comunicazione veloce: gli esseri umani forniscono ed elaborano l’audio molto più rapidamente rispetto a tutti gli altri media.”: non sono sicuro a quali altri media si riferisca, ma sappiamo che gli esseri umani sono principalmente animali visivi.
  7. “Modo di comunicazione più semplice: la voce non è solo più veloce; è anche più facile che scrivere un messaggio.”: ciò non implica che l’utente sappia sempre cosa dire.
  8. “Modo di interazione più conveniente: l’interazione con una VUI richiede semplicemente che un utente parli con il dispositivo.”: nel mondo reale, le CUI operano in un ambito funzionale limitato, quindi gli utenti devono effettivamente comprendere i vincoli del sistema.

Le CUI sono state promosse e difese con fervore, principalmente da società di sviluppo di bot. Ma, perché ritengo che le CUI rappresentino un passo indietro per l’usabilità, similmente a MS-DOS? Le ragioni sono due:

  1. Bassa rilevabilità e comprensione dell’ambito del sistema: gli indizi visivi, i suggerimenti, gli inviti e l’organizzazione spaziale delle informazioni sono tutti strumenti che una GUI usa per garantire rilevabilità, comprensione e usabilità. I chatbot mancano di entrambe queste qualità.
  2. Le conversazioni sono inefficienti per processi complessi: la ricerca del Nielsen Norman Group ha rilevato che “sia gli assistenti intelligenti solo vocali che quelli basati sullo schermo funzionano bene solo per query molto limitate e semplici”. Le CUI risultano efficienti solo quando l’utente sa esattamente cosa vuole e come richiederlo. Ma non interagiamo sempre in questo modo con siti web e applicazioni.

Nonostante le critiche siano maggiormente rivolte ai chatbot, anche gli assistenti vocali devono affrontare questi problemi. I progressi nel Processing del Linguaggio Naturale (PLN) hanno reso assistenti come Siri e Alexa molto intelligenti, ma le CUI hanno ancora molta strada da fare per garantire un’esperienza utente veramente fluida e intuitiva.

Booking.com e l’uso delle interfacce vocali

Una nuova sfida per il settore dell’e-commerce

La Barra di Ricerca Principale di Booking.com e il suo Chatbot

Non sorprende che una ricerca recente abbia indicato gli assistenti intelligenti come supporto insufficiente per il confronto e lo shopping.

Ecco un esempio: nelle piattaforme di e-commerce, il modo più semplice e intuitivo per visualizzare variazioni di colore di un prodotto è selezionare un colore dalla tavolozza disponibile. Tuttavia, nell’ambito di una conversazione con un chatbot, la richiesta diventa molto più articolata e dispendiosa in termini di tempo. Inoltre, azioni che su un smartphone sono immediate, come l’eliminazione di un elemento, possono diventare molto più complicate quando ci si trova a interagire con un chatbot, come quello di Blink su Facebook Messenger.

Problemi di usabilità e l’efficienza dei Comandi

Gli elementi standard dell’interfaccia utente (pulsanti, schede di navigazione, liste) facilitano l’orientamento dell’utente senza obbligarlo a formulare esigenze dettagliate, in quanto i designer hanno già anticipato le loro necessità. Molte volte, fare clic su un’icona risulta molto più efficiente che dover verbalizzare o digitare la propria intenzione. Queste astrazioni significative contribuiscono ad aumentare l’efficienza degli utenti.

I Chatbot come App

I chatbot possono esistere come app indipendenti o funzioni integrate in altri servizi, come assistenti di customer care sui siti web, o possono essere ospitati su piattaforme come Messenger o Kik.

Spesso, si sostiene che uno dei vantaggi dei chatbot sia l’eliminazione della necessità di scaricare un’app separata.

Tuttavia, oggi, lo sforzo richiesto per scaricare un’app non sembra più gravoso di quello necessario per cercare un chatbot specifico su un’altra app.

In sostanza, i chatbot si sono trasformati in mini-app all’interno di altre app, simili ai mini-programmi di WeChat.

Il valore delle interfacce conversazionali

CUI ha il suo valore nelle situazioni in cui è necessario instaurare un dialogo. Un esempio ideale di ciò è l’uso dei chatbot nel settore dei servizi clienti. Inoltre, ci sono situazioni in cui una conversazione, anche con un robot, può essere rilevante.

Ad esempio, Spot, un servizio web per segnalare molestie e discriminazioni sul lavoro, utilizza un chatbot per guidare gli utenti in un dialogo simulato.

In difesa delle Interfacce Grafiche

La potenza delle interfacce grafiche risiede nella loro capacità di creare spazi informativi intuitivi per l’utente.

Questo facilita la creazione di un modello mentale dell’architettura e delle capacità del sistema.

Allo stesso tempo, offre all’utente un linguaggio per identificare queste capacità e una modalità per attivarle senza dover esprimere esplicitamente le proprie intenzioni.

Le forme di comunicazione umana sono naturalmente imperfette e, in certi casi, il linguaggio e la conversazione quotidiana non sono sufficienti.

Pertanto, l’umanità ha sviluppato metodi codificati e standardizzati per facilitare la comunicazione in vari contesti.

Questo vale anche per le interfacce utente, che sono state progressivamente codificate per rendere la tecnologia accessibile a tutti.