Los asistentes de voz como Siri, Google Now/Assistant, Cortana, etc. ya llevan un tiempo entre nosotros, y aunque aún les queda mucho para poder estar 100% integrados en nuestro día a día, cada vez somos más los que interaccionamos con algún tipo de asistente de voz para ayudarnos a controlar algún dispositivo.
En mi caso todavía no he llegado a utilizar mucho el asistente de voz en mi teléfono, pero si que utilizo (y mucho), el asistente de Google en mi dispositivo Nvidia Shield que tengo conectado a la televisión y que se ha convertido en el «centro de mi salón».
Como el controlador de la Nvidia Shield es un mando tipo consola, resulta bastante pesado escribir en el teclado virtual que sale en cualquier buscador (por ejemplo el de YouTube) cuando buscas poner algo en el dispositivo. Pero el asistente de voz lo facilita muchísimo, ya que es pulsar un botón, hablarle al mando de la Nvidia Shield (que tiene un pequeño micro para esto en el propio mando) y ponerte a ver el vídeo que quieras.
Más recientemente he introducido otro asistente de voz en mi vida, esta vez uno con forma de altavoz, como es el Amazon Alexa Echo, gracias a ser beta-tester del servicio Alexa en España.
Como en el salón ya tengo la Nvidia Shield para controlar la televisión, he decidido testar Alexa en la cocina, ya que siendo un «cocinillas» de pro, paso bastante tiempo en la cocina y siempre hecho en falta algún tipo de dispositivo inteligente. Cosas que por ahora me permite Alexa y a las que les estoy cogiendo el gusto:
Además en la cocina surgen multitud de usos más, que todavía no están al alcance de la mano en España, pero sí en Estados Unidos y llegarán aquí en breve como es el poder pedirle a Alexa que te lea una receta de algún sitio importante de recetas, o si tienes dispositivos inteligentes en la cocina (todavía no es mi caso) poderlos conectar a este dispositivo. Algunas cosas curiosas que ya se pueden conectar a un dispositivo Alexa:
En mi experiencia estos dispositivos todavía están algo verdes (y todavía más cuando tratas de usarlos fuera de EEUU, como es el caso), pero ya resultan útiles y se empiezan a integrar en nuestras vidas con cierta facilidad, y viendo la cantidad de inversión que se está realizando en este mercado, no me extrañaría que en 3 años más o menos hayan evolucionado lo suficiente como para tener una parte importante dentro de nuestro día a día.
A modo de anécdota graciosa, Bethesda (un importante estudio de videojuegos), ha coñeado acerca de portar Skyrim, uno de sus juegos más importantes a Alexa (el asistente de voz de Amazon) gracias a un vídeo muy divertido.
Ya hablábamos de ellos hace apenas unos artículos cuando divagábamos acerca de la necesidad de controlar tus propios canales de comunicación. Pero si no leíste ese artículo y no sabes quiénes son te lo contamos. Los 5 gigantes tecnológicos son: Google, Amazon, Apple, Facebook y Microsoft, y su capitalización bursátil conjunta está por encima de los 3.000.000 millones de dólares.
Por lo general existen ciertos puntos de encuentro y de desencuentro entre estas compañías, pero cuando todas ellas están presentes en un mercado significa algo gordo se está cociendo. Y en el caso de los asistentes de voz, absolutamente todas tienen intereses desde hace ya tiempo.
Apple y Google son los que han tenido hasta hace relativamente poco tiempo la voz cantante debido al uso de sus asistentes de voz Apple Siri y Google Now (ahora Google Assistant), pero desde que Amazon se ha metido de cabeza en este mercado con su línea de productos Amazon Alexa, ha empezado a tener una posición súper relevante. Microsoft lleva tiempo dándole caña con su asistente Cortana que ya está integrado en Windows y Facebook pudiera parecer que era el que menos interés tenía pero desde hace años Marc Zuckerberg ya anunció su interés por este mercado a nivel personal con su «Jarvis» hecho por sí mismo, y Facebook ya ha anunciado el pasado febrero que de cara al verano sacarán su línea de altavoces inteligentes con asistente de voz propio y se llamarán Aloha y Fiona.
PwC acaba de lanzar un fabuloso informe titulado «Prepare for the voice revolution» donde analiza a fondo este mercado y en este estudio podemos ver algunos datos que nos dejan claro que la mayoría de los usuarios ya conocen e interaccionan de forma más o menos habitual con las tecnologías de interacción por voz.
El 90% de los usuarios reconocen conocer estas tecnologías, y el 72% de estos usuarios ya han utilizado algún tipo de tecnología de interacción por voz. Veamos en la siguiente imagen los dispositivos con los que suelen interactuar más habitualmente:
Curiosamente, parece que los asistentes de voz están cogiendo más tirón desde que han aparecido dispositivos específicos para su uso, a pesar de que ya hace tiempo que están disponibles en cualquier móvil. La explicación nos la aporta también este estudio, que nos confirma que la mayoría de los consumidores (74%) prefiere utilizar los asistentes de voz en la intimidad de su casa y no en cualquier otro lado por temas de privacidad.
Por ahora la mayoría de los usuarios de este tipo de tecnologías las utilizan con fines relativamente básicos (búsquedas, responder a preguntas, comprobar el tiempo, reproducir música), guiados seguramente por el desconocimiento de todo el potencial que nos brindan, la falta de desarrollo de la tecnología para poder reconocer todo lo que le dicen los usuarios (sobre todo cuando se habla en idiomas que no son el inglés) y la falta de confianza para realizar tareas más complejas.
Ahora bien, ya se están utilizando estos dispositivos para realizara compras en algunos verticales, como se demuestra con los datos del estudio de Capgemini sobre Conversational Commerce:
Para que los usuarios puedan comprar a través de los dispositivos de interacción conversacional no basta solo con que los asistentes entiendan lo que les decimos y sean capaces de respondernos, sino que hace falta disponer de un ecosistema de sistemas interconectados que sean capaces de «hablar entre sí» para trasladar cada consulta o necesidad del usuario al servicio más adecuado.
Gracias al interés que ha suscitado este tipo de tecnologías, cada vez disponemos de un ecosistema conversacional más rico, como podemos ver con algunos de los siguientes ejemplos:
Comentábamos que los 5 gigantes tecnológicos están metidos en esta gran batalla por el control por voz, pero los dos grandes de esta tecnología son Google y Amazon. Google por estar acaparando el mayor número de acuerdos con retailers y servicios de venta (seguramente porque los retailers tratan de evitar a Amazon que es el «retail-killer») y Amazon por ser el líder en ventas en cuanto a dispositivos de control por voz inteligentes y en algunos otros aspectos.
En cuanto al número de dispositivos distintos que se pueden conectar a cada uno de los sistemas, Amazon Alexa gana por goleada, ya que su foco se ha encontrado desde un primer lugar en ser un dispositivo que lidere el mundo del IoT:
En cuanto a cuota de mercado, Amazon lideraba ampliamente en 2017 con casi un 70% de la cuota de mercado, pero esta posición extremadamente dominante está cayendo en 2018 donde baja su cuota de mercado hasta el 51%. Apple entra en la competición de los altavoces inteligentes con su HomePod (aunque no es comparable porque es mucho más altavoz que inteligente), Google aumenta su cuota de mercado y se ve como entran los players asiáticos como Xiaomi y Alibaba en la pugna.
Otro dato interesante es ver como Alexa cada vez gestiona más «Skills» o habilidades que ofrecen terceras partes en esta plataforma. Debido a su foco en la interoperabilidad de su plataforma con otros dispositivos, Alexa va a la cabeza, con mucha diferencia, a este respecto.
Cada uno de los gigantes tecnológicos metidos en esta batalla tienen un objetivo en mente. En el caso de Amazon el objetivo es claro, Alexa es un caballo de Troya para meterse en todas las casas posibles de forma que cuando alguien diga «Alexa, compra leche» o «Alexa, compra un monitor para mi ordenador», sea Amazon quien procese esa compra.
Para RBC Capital Markets, este movimiento puede ser un «mega-hit» similar al que ha supuesto AWS, que le permitiría a Amazon generar 10.000 millones de dólares en 2020 gracias a tener más de 500 millones de usuarios en todo el mundo utilizando dispositivos Alexa (lo cuál generaría ya 5.000 millones de dólares en ventas). Esta capilaridad y penetración, unida a que el uso de dispositivos como Alexa debería permitirle a Amazon crecer un 5% el valor de cada usuario de forma anual, añadiría 5.000 millones de dólares a las cuentas anuales de Amazon debido al incremento en ventas generadas desde estos dispositivos.
Esto serían 10.000 millones de dólares «directos para la hucha», a lo que habría que sumarle todo lo que pueda generar el marketplace que se está montando alrededor de Alexa con sus Skills, así como la explotación de datos recogidos por Alexa que puedan ser de interés para terceras partes.
Google Assistant será capaz de reservar tu próxima hora en una peluquería, aunque esta peluquería no tenga ni un solo dispositivo conectado, y esto lo hemos podido ver en la pasada Google I/O de 2018 en la que Google mostraba esta demo de Google Duplex que ha asombrado a absolutamente todo el mundo.
Como podemos ver, si Amazon va a la conquista de la compra gracias a Alexa, Google pretende dominar el mundo (como siempre) gracias a Duplex y Assistant, y quieren estar totalmente involucrados en cualquier tipo de tarea que podamos realizar en nuestro día a día.
La demo puede parecer «simple» para quién no entienda de tecnología, pero para poder llegar a este punto, han tenido que desarrollar multitud de tecnologías complejas en las áreas del lenguaje natural, deep learning, texto a habla, reconocimiento de habla, etc. Básicamente una demo de unos pequeños minutos que exprime al máximo décadas de investigación súper bien integradas y colocadas con un precioso lacito en un evento que nos ha emocionado y acojonado a partes iguales.
Tengámoslo claro, la tecnología ya está suficientemente madura como para que lo conversacional se vaya integrando en nuestras vidas durante los próximos 3 años, y va a pasar lo queramos o no, nos guste más o menos… Lo importante ahora no es plantearse si integrar estas tecnologías en nuestras estrategias, si no comprender el impacto que va a tener en los negocios y en la Sociedad.
Por un lado tenemos un importante reto de ver cómo integrar este tipo de tecnologías en nuestra Sociedad. Y este debate ha estado ahí desde hace mucho tiempo (se ha discutido desde un punto de vista filosófico en los círculos de la IA durante años), pero más recientemente se ha hablado concretamente tras la presentación de Google Duplex por una periodista de CNET.
Un debate interesante que no tiene una respuesta fácil y que tenemos que discutir como Sociedad poco a poco, ya que no va a ser el único reto que nos planteen las tecnologías derivadas de la Inteligencia Artificial.
Por otro lado lo conversacional plantea un giro sustancial de la mayoría de las bases de los negocios digitales (a día de hoy ya cualquier negocio). Desde hace tiempo se habla del impacto en la búsqueda, por ejemplo, ya que las interfaces conversacionales son más propicias para realizar consultas más largas y específicas, casi siempre desde dispositivos móviles y con mayores variaciones debido a que solemos hablar de una forma más informal de la que escribimos. También implica un mayor nivel de geolocalización debido a que vamos a facilitar realizar búsquedas en momentos concretos en los que no estamos ni en casa ni en el trabajo, como pueda ser conduciendo, haciendo deporte, etc. Y en este tipo de actividades el contexto es más importante.
Pero si miramos más allá el panorama va a cambiar muchísimo más. Una interfaz conversacional es más dada a una sola respuesta a una pregunta, por lo que posicionar para top 1 en búsquedas de voz va a ser algo crítico y que puede dejar fuera de juego a mucha gente. Y si vamos más allá, vamos a tener que empezar a hacer SEO para IoT, es decir, SEO para que nos encuentren los dispositivos conectados que estén buscando una respuesta concreta para una necesidad de sus dueños.
Y es que en un futuro no buscaremos, simplemente pediremos algo así como «Alexa, necesito un monitor nuevo y los cómics de Guanteletes del Infinito en tapa dura y que me llegue todo en una hora» y nos despreocuparemos, porque sabremos que el dispositivo inteligente se encargará de que eso suceda, al mejor precio, en el menor tiempo posible, utilizando nuestro método de pago habitual y recibiendo los productos en la ubicación habitual más cercana a la que nos encontremos en ese momento.