Il 2016 è l’anno del sonoro

Così come dicevo nel primo numero di Mixer, analizzando le tendenze di dicembre 2015, è chiaro che gli sviluppi sonori sono indirizzati verso l’intelligenza artificiale, il multiroom, gli assistenti vocali e l’alta fedeltà.

A supportare questa analisi è arrivato l’articolo de Il Sole 24ore che parla di audio aumentato.

E poi il 3 gennaio Mark Zuchenberg ha postato una serie di buoni propositi per il 2016 in cui ha detto che uno degli obiettivi è quella di sviluppare l’intelligenza artificiale e l’assistenza vocale:

Every year, I take on a personal challenge to learn new things and grow outside my work at Facebook. My challenges in recent years have been to read two books every month, learn Mandarin and meet a new person every day.
My personal challenge for 2016 is to build a simple AI to run my home and help me with my work. You can think of it kind of like Jarvis in Iron Man.
I’m going to start by exploring what technology is already out there. Then I’ll start teaching it to understand my voice to control everything in our home — music, lights, temperature and so on. I’ll teach it to let friends in by looking at their faces when they ring the doorbell. I’ll teach it to let me know if anything is going on in Max’s room that I need to check on when I’m not with her. On the work side, it’ll help me visualize data in VR to help me build better services and lead my organizations more effectively.
Every challenge has a theme, and this year’s theme is invention.
At Facebook I spend a lot of time working with engineers to build new things. Some of the most rewarding work involves getting deep into the details of technical projects. I do this with Internet.org when we discuss the physics of building solar-powered planes and satellites to beam down internet access. I do this with Oculus when we get into the details of the controllers or the software we’re designing. I do this with Messenger when we discuss our AI to answer any question you have. But it’s a different kind of rewarding to build things yourself, so this year my personal challenge is to do that.
This should be a fun intellectual challenge to code this for myself. I’m looking forward to sharing what I learn over the course of the year.

Posted by Mark Zuckerberg on Sunday, 3 January 2016

Un post che mi ha fatto subito drizzare le orecchie!

Negli ultimi anni, leggiamo che Mark Zuckerberg, ha avuto propositi come quelli di leggere 2 libri al mese, incontrare una nuova persona ogni giorno o qualcosa di più impegnativo come imparare il Mandarino.

Per quest’anno, invece, i suoi propositi sono un po’ più alti e rivolti alla tecnologia più avanzata: l’intelligenza artificiale prima di tutto (che ha destato maggiori attenzioni tra i media, anche per il suo riferimento a Jarvis l’assistente vocale di Iron Man) per la propria casa e il proprio lavoro; e, per quanto ci riguarda, il secondo proposito è quello di iniziare a insegnare all’intelligenza artificiale a capire la sua voce per controllare ogni cosa nella sua casa – musica, luci e via di seguito.

I think we can build AI so it works for us and helps us. Some people fear-monger about how AI is a huge danger, but that seems far-fetched to me and much less likely than disasters due to widespread disease, violence, etc.

I suoi fan gli hanno già contestato qualcosa. Come ad esempio il fatto che stia pensando alla sua casa e non a quella degli altri. Ma Zuckerberg risponde subito che ogni casa ha le sue caratteristiche e lui prima vuole fare una prova in casa sua in modo da poter testare personalmente eventuali difetti e di permettere la diffusione in tutte le case quando si raggiungerà uno standard comune per tutte le case.

I will definitely keep our community updated on what I learn, and I hope others can learn from it too. The reason I’m building this just for myself is that the technology in every home is different, so it’ll be much easier for me to start just building this for mine that building a general product that works for everyone.

Mark Zuchenberg continua:

Third, our AI research team is making progress helping computers to see and understand. We recently built a prototype that combines language and vision comprehension so it can answer questions about an image. We’re using AI to help blind people in our community experience their friends’ photos by having our systems describe the scenes. I’m also doing my own personal challenge to build a simple AI to help run my home and help with my work. This is an area I’m personally very interested in long term.
This is the year a lot of what we’re working on will start to be available to our community. I have personally spent a lot of time on these projects and I’m excited to share more about what we’re building!

D’altronde il controllo di una casa connessa online è cosa già fatta. L’internet delle cose non è una novità. E per esempio anche le start up italiane come www.alfredsmarthome.com se ne occupano e hanno già buoni risultati.

Lo stesso Google da ottobre 2015 sta rilasciando intelligenza artificiale anche online, per dare risposte alle ricerche più efficienti e più vicine alla semantica. L’intelligenza artificiale ha le sue applicazioni sparse anche nei nostri più miseri telefonini e smartphone. E il controllo di una casa connessa è già presente in progetti già in stato avanzato come questo uovo davvero eccezionale

Ritorniamo all’anno del sonoro.

Devo, ammettere però, che al di là del fatto che a scrivere sia stato Mark Zucherberg in persona, mi stupisce l’attenzione della stampa. L’uso di intelligenza artificiale da parte di Facebook è notizia del 26 agosto 2015 data da David Marcus.  E ad ottobre 2015 sempre Facebook ha rilasciato il suo assistente digitale vocale Facebook M. E’ ancora in fase beta, per un gruppo ristretto di persone di San Francisco, e non si sa quando sarà rilasciato a tutti gli utenti di Facebook Messenger. Le funzionalità sono certamente interessanti, fanno pensare a Her, film del 2013 scritto e diretto da Spike Jonze, con protagonista Joaquin Phoenix. Facebook M riesce a fornire un ottimo servizio per relazionarsi con altri sistemi di automazione (tipo il servizio clienti di Amazon, attesa ai call center, lettura delle mail), ma pare abbia difficoltà a relazionarsi con sistemi non automatizzati. Per supplire a questo deficit di intelligenza artificiale è supervisionata da gruppi di persone fisiche che rispondono, in diretta, alle varie domande. Semmai non è chiaro dove si trovi il confine tra automazione e persona fisica (o gruppi di persone) e soprattutto che tipo di lavoratori siano questi ultimi (ma questa è un’altra storia).

Se Mark metterà un portiere che risponderà da call center per lui mi pare che non ci sia nessuna evoluzione. Meglio DoorBird ed essere sicuro di aprire alle persone giuste e a chi vuoi tu senza sfruttare nessuno.

Personalmente, invece, senza nulla togliere all’intelligenza artificiale che vedrà ancora tanta evoluzione (gli esperti dicono che siamo solo all’inizio), ritengo che il post di Mark sia più importante per l’architettura dell’informazione sonora e dell’audio perché non c’è nulla da inventare ex-novo, ma ci si dovrà limitare a sviluppare e migliorare tecnologie che sono già in uno stato di sviluppo abbastanza avanzato. Semmai la notizia è che a Dicembre 2016 dovremmo vedere rilasciato qualche servizio applicato.

Nonostante lo stesso Mark, parli di voce e riconoscimento vocale, per lui, così come per la maggior parte delle persone, l’Intelligenza Artificiale è qualcosa di legato al visivo e non proprio al sonoro. Zuckerberg, infatti, spiega ad una sua fan che chiede cosa si intende per AI:

Artificial intelligence. In this case it means I’ll be able to interact with it like a person: I’ll talk to it, it can see me and my facial expressions, it’ll be able to predict some of what I need ahead of time, etc.

Mark Zuckerberg insegnerà, infatti, a riconoscere la faccia dei suoi amici per aprire loro la porta quando questi suonano il campanello, oppure gli insegnerà ad aiutarlo a badare alla piccola Max.

E non sarebbe una tirchieria se un’Intelligenza artificiale, al citofono di casa Zuckerberg, non chiedesse nemmeno “chi è?”

Ma Facebook, che  comunque già riconosce i volti delle persone per favorire il tag, non è il solo ad interessarsi al tema. Per esempio, proprio in questi giorni Apple ha acquisito, pochi giorni fa, la startup Emotient con il quale Siri ed iPhone potrebbero riconoscere le emozioni.  Anche se non è chiaro l’uso che ne vorrà fare Apple.

E anche in questo caso, se non risponderà nel tono giusto alle nostre emozioni quale sarebbe la novità?

Per fortuna, per chi si occupa da più anni del controllo degli spazi e dell’internet delle cose, l’interfaccia vocale sta al centro del proprio prodotto. Se non avete grandi pretese, potete controllare poche luci e pochi sensori anche gratis, con Home Automated living e un’intera casa pagando.

E il mondo degli assistenti vocali si sta moltiplicando. Al momento i più avanzati assistenti vocali, sul mercato e già in nostro possesso sui nostri smartphone, sono, appunto, Siri di Apple, Cortana di Microsoft e Google Now; ma ne stanno nascendo altri. Sulla rubrica Mixer e più avanti ve ne farò scoprire un bel po’ anche di sconosciuti.

E in effetti, sempre nei commenti, Mark ammette che già usa un’assistente vocale della concorrenza, che risponde benissimo alle sue necessità. Per far ascoltare la musica alla propria figlia per farla addormentare, Mark usa Alexa, l’assistente vocale di Amazon Amazon Echo

Dice Zuckerberg

For just music, the Amazon Echo is pretty great. It’s been very useful for controlling music with my voice while both hands are occupied taking care of Max. I’ve also been impressed with how much free music comes with Amazon Prime. That said, I only have an Echo in one room and it doesn’t have all my music, so it’s not perfect yet.

I’m very interested in using voice and face recognition to set lights and temperature as well depending on who is in what rooms, etc. For example, I like rooms colder than Cilla, and but it’s possible to just see who is in what room and adjust the temperatures automatically.

Alexa, inoltre, ha una buona fama tra chi sta sviluppando gli assistenti vocali, infatti pare essere tra gli assistenti vocali sia il più promettente.

Capisco dunque che la grafica e il visuale attireranno sempre di più la nostra attenzione ma concorderete con me che lo spazio di sviluppo è in gran parte sonoro. Staremo a sentire!