I segreti della progettazione conversazionale di Google sono le buone pratiche da seguire per progettare conversazioni per assistenti vocali. Analizzare queste pratiche e metterle a sistema sarà compito dell’architettura dell’informazione e di quello che io chiamo architettura dell’informazione sonora. Discipline, insomma, che hanno e avranno a che fare (sempre più) con l’esperienza umana, con l’organizzazione delle informazioni, con l’esperienza uomo-macchina, con la robotica e la domotica.

La progettazione di assistenti vocali è un lavoro trasversale che vedrà la partecipazione di molteplici figure professionali umanistiche con influenze tecniche. Come spiegava, appunto, Piero Savastano nella sua intervista rilasciata al blog.

Perché se c’è un segreto per progettare conversazioni è uno. E non è un segreto. Cioè riuscire a rendere le macchine davvero umane. O, quanto meno, far sembrare le macchine più umane possibile.

A sostenerlo, non sono da solo. Lo dice anche Mark Wilson+ sulla rivista Fastcodesign che sottolinea 3 segreti di Google per progettare conversazioni.

Le conversazioni di Google

Quest’anno Google ha presentato una serie di prodotti dedicati all’uso dell’assistenza vocale e in particolar modo di Google  Home. Alphabet, l’azienda madre di Google, infatti, ha aperto il suo business al nuovo mercato della domotica. Un mercato già avviato da tempo a cui Google e Amazon stanno dando una notevole accelerazione.

Progettare conversazioni perfette

Sembrerebbe che parlare con le macchine sia qualcosa di intuitivo per tutti. In quanto essere parlanti non dobbiamo essere noi a leggere il manuale delle istruzioni ma è la macchina che deve imparare a parlare come un essere umano. L’Uomo non deve imparare alcun linguaggio complicato per parlare ad uno smart speaker. Basta premere un pulsante e chiedere.

Questo, almeno, in teoria. Perché seppure in teoria non dovrebbero esserci problemi, alcune difficoltà tecniche e psicologiche fanno da barriera. Nonostante il grande miglioramento di prestazioni di questa tecnologia, ancora oggi non tutte le conversazioni vanno a buon fine e i bot falliscono.

È capitato a tutti, infatti, di provare l’assistenza vocale di uno smartphone qualunque e sperimentare l’esperienza di non essere capiti. I motivi sono vari. Forse il nostro smartphone non è all’altezza della situazione e si blocca. Forse il microfono del nostro dispositivo funziona male e non percepisce bene la nostra voce. Quindi l’assistente vocale non sente proprio. Altre volte l’assistente capisce altro rispetto a quello che abbiamo chiesto.

Architettura dell’informazione conversazionale

Come scrivevo tempo fa e riportando cosa diceva Morville sull’architettura dell’informazione conversazionale l’uso degli assistenti vocali porta a pensare che siamo noi che funzioniamo male e quindi ci stanchiamo presto dell’uso.

L’assistenza vocale non fa ancora parte del nostro contesto, dei nostri ecosistemi. E quando assistiamo a dimostrazioni su questa tecnologia è evidente che si trovano in ambienti ideali, luoghi silenziosi, persone solitarie, o famiglie che parlano poco.

L’inserimento nel nostro ecosistema degli smart speaker, come parte integrante della nostra quotidianità, non sarà cosa che avverrà in breve tempo. E per questo motivo sostengo che l’assistenza vocale non si affermerà da se, come tecnologia assestante. Ma altre industrie, altri ambiti di conversazione, ci abitueranno al loro uso, come accessorio.

Ci vorrà anche un patto sociale e culturale che permetta a tutti di accettare gli assistenti vocali nella nostra vita. Bisognerà accettare il fatto che entrando in una casa, ad un certo punto, un assistente vocale ci rivolgerà la parola. E magari eseguirà un nostro comando. Altro che case invisibili.

Progettare conversazioni complesse

Le nostre conversazioni si attuano all’interno di un complesso sistema di regole. Sostenere una conversazione con l’altro non è certamente una azione facile. Generalmente i parlanti sono degli esperti nelle conversazioni. Il nostro linguaggio è il risultato di migliaia di anni di conversazioni. Il nostro parlato si è sviluppato ed evoluto ed è in continuo mutamento. È  per questo motivo che le persone hanno grandi aspettative a riguardo.

Alla conferenza I / O di Google si è parlato a lungo di conversazioni. Ciascun relatore ha dato la sua ricetta per la conversazione perfetta. Qui riporto quanto Wilson ha estrapolato tra le pratiche migliori per una conversazione presentate alla conferenza.

Impara dai grandi dialoghisti

Padgett paragona le interfacce vocali all’hamburger menu. Le tre strisce che ricordano un hamburger e dal quale si accede al menu di un sito web sviluppato per il mobile. L’hamburger menu ha ricevuto e riceve critiche  perché nasconde la navigazione del menu che prima era evidente. Alcune persone ci restano incastrate e non riescono a navigare il sito.

Lo stesso avviene in una conversazione. Le persone una volta entrati in contatto con un contenuto, non avendo nessuna interfaccia grafica, hanno difficoltà a navigare ed uscire da quel contenuto. Come se ne esce? Come nella vita reale. Nelle conversazioni dal vivo si fa ricorso alle norme sociali. Lo stesso andrebbe fatto e viene fatto con gli assistenti vocali. Usando i vari saluti, per esempio, oppure effettuando altre richieste di informazione, o ancora riprendendo conversazioni già avute con il bot.

Mark Wilson scrive.

Dopo aver trascorso 20 anni alla Pixar, Oren Jacob, fondatore della compagnia Pullstring, sostiene che l’intero settore si concentri troppo sull’utilizzo dell’intelligenza artificiale. Con l’intenzione di anticipare ciò che un essere umano potrebbe potenzialmente chiedere in qualsiasi momento. E non si concetri abbastanza su una conversazione scritta con cura, piena di caratteri costruiti da dialoghi, che si dispiega proprio come uno script di Hollywood.

“Puoi pensare a questo spazio come ad una sceneggiatura interattiva”,

dice Oren Jacob.

Principio cooperativo

James Giongola, capo creativo per la progettazione delle conversazioni presso Google, invita i progettisti di chat ad utilizzare le regole del principio cooperativo.

Sul blog trovi un post dedicato interamente al principio cooperativo di Grice. Intanto, per non allontanarci troppo dal nostro discorso, basta sapere che il principio cooperativo è un concetto creato dal filosofo britannico Paul Grice negli anni ’70.

Grice ha teorizzato che le persone impiegano alcune norme, (conosciute come massime di Grice) per assicurarsi che le conversazioni fluiscano normalmente.

Che cosa significa in pratica? Significa che se qualcuno ti fa una domanda tu risponderai continuando il dialogo. Secondo un principio di collaborazione. Per esempio: “Sta sera, vai alla festa di compleanno?” La risposta, se vuoi conversare, non sarà (generalmente) una risposta chiusa, si o no. Ma molto probabilmente la risposta sarà “Si, vado alle nove!”, oppure: “Ci vado più tardi con la mia fidanzata”. O ancora. “No, non posso andare. Ho un’altro appuntamento”. Il dialogo, la conversazione, potrebbe continuare in un rimando di botta e risposta che continua la conversazione. E tu? Che fai? Andrai?…  e così via.

Almeno fin quando si vuole conversare.

Fai finta di niente, come fa la gente

A chi non è capitato di trovarsi in un locale rumoroso e perdersi alcune parole di quello che dicono gli altri?  Generalmente si hanno due scelte. La prima è quella di far ripetere la frase o la parola che non si è capito o sentito. Ma altre volte, se il discorso è di scarso interesse o frivolo, oppure si riesce a ricostruire il senso, si preferisce far andare avanti il discorso e non far perdere il ritmo della conversazione al nostro interlocutore. Così capita di saltare intere parti che non si reputano importanti.

Infatti, non tutte le parti del discorso sono sempre utili per portare avanti la nostra conversazione.

Così faranno gli assistenti vocali.

Cosa fa Google se non capisce?

Google ricondurrà quasi sempre ad una domanda su ciò che manca, utilizzando uno strumento chiamato “reprompt rapido”. Un reprompt è la stessa domanda chiesta nuovamente con frasi diverse.

Cosa fa un progettista di conversazioni?

E se continua a non capire? La prima, la seconda, la terza volta? Che succede? Diciamo che data la pretenziosità della gente è probabile che la conversazione venga abbandonata. Da progettista, però, bisogna porsi qualche domanda.

Si continua a chiedere un chiarimento? Oppure si suppongono alcuni dati?

Se, per esempio, qualcuno ha prenotato un tavolo e non abbiamo il numero certo di persone del tavolo, che facciamo? Chiederemo il numero esatto all’infinito oppure si presuppone che siano meno di 20 persone?

Quale errore sarà preferibile?

Non aver paura delle personalità forti

Nella vita reale, può essere difficile connettersi a qualcuno che sembra non avere opinioni o nessuna passione o proprie preferenze. Lo stesso vale per gli assistenti vocali.

Certo è che non è possibile creare un bot che piaccia a tutti. E anche se ci si riuscisse sarebbe un bot abbastanza noioso. Nello stesso tempo non possiamo avere un bot troppo severo e assertivo.

Il nostro bot deve rispecchiare il nostro marchio. Il nostro brand sarà impersonato da quel bot.

Brad Abrams, responsabile del gruppo di prodotti per la piattaforma Google Assistant, ha rivelato che Google ha scoperto che i robot di conversazione con cui le persone si sono maggiormente relazionate sono state proprio quei bot con un carattere più forte.

Person sheet

Per costruire il proprio bot per l’I / O di Google app, Abrams e la squadra hanno creato un “person sheet”. Il person sheet è uno strumento che serve come riferimento stenografico (scritto con segni) su come parla un bot. Questo strumento, specifica diverse decisioni di fraseggio che il bot potrebbe esprimere.

In pratica un bot può avere decine di modi di dire “Hai ragione” oppure “Hai sbagliato”. Variando nelle frasi e nei modi in maniera più o meno incoraggiante.

Assistenti vocali proattivi

Ma i bot non devono servire pedissequamente le persone. Stocker sostiene che ci sono molti casi in cui gli errori di Google Home potrebbero portare le persone ad utilizzare altri assistenti con un carattere più forte.

Un esempio che ha portato all’attenzione della platea è quello di una app di prenotazione al ristorante. Questa app richiede l’ora in cui vorresti cenare. Se il bot non capisce la risposta, può entrare in una modalità proattiva, dicendo: “Posso prenotarti per le 20:30, sei d’accordo?” Saltando diversi passaggi in avanti e indietro della discussione. Proprio come fanno gli esseri umani, il bot dovrebbe cadere sempre in piedi, anche se non capisce esattamente cosa sta succedendo.

Conclusioni

Ricapitolando. Sia che vuoi progettare conversazioni, sia che vuoi solo capire come funziona un assistente vocale.

  • Dialoga dialoga, dialoga.
  • Supera gli errori in un modo o nell’altro.
  • Dai una personalità al tuo bot.

Cosa aggiungere di più per progettare conversazioni?