Cuando los asistentes de IA llegaron al mercado por primera vez, estaban lejos de ser omnipresentes, pero gracias a que más fabricantes de equipos originales se subieron al carro de los altavoces inteligentes, hay más opciones de dispositivos con asistente que nunca. Además de la creciente variedad, en términos de hardware, los dispositivos que soportan múltiples tipos de asistentes de IA son cada vez más comunes. A pesar de la mayor integración, la competencia entre los asistentes de IA sigue siendo dura, así que para ahorrarte tiempo y frustración, hemos realizado una extensa prueba práctica, no para comparar altavoces entre sí, sino para comparar los propios asistentes de IA.
Hay cuatro punteros en el espacio de los asistentes de IA: Amazon (Alexa), Apple (Siri), Google (Google Assistant) y Microsoft (Cortana). En lugar de evaluar la eficacia de cada asistente basándome en las características que la empresa ha comunicado, pasé horas probando cada uno de ellos emitiendo órdenes y haciendo preguntas que muchos usuarios empresariales utilizarían. Construí preguntas para probar la comprensión básica, así como la comprensión contextual y el reconocimiento vocal general.
Accesibilidad y tendencias
La accesibilidad se refiere a cuántos dispositivos vive el asistente virtual. La mejor manera de medir estos asistentes de IA entre sí en esta categoría es considerarlos individualmente. Se enumeran de más accesible a menos accesible.
Asistente de Google
Asistente de Google está disponible en todos los dispositivos Android e iOS, así como en los Chromebooks. Google tiene su propia línea de altavoces Google Home, incluyendo Google Home Mini (49 dólares), Google Home (129 dólares) y Google Home Max (399 dólares), todos ellos construidos para su uso con Google Assistant. Google también facilita la búsqueda de altavoces de terceros compatibles con Google AI, como el Harman JBL Link 10 (99,99 €), el Sony LF-S50G (199,99 €), el Panasonic SC-GA10 (249,99 €), el Onkyo VC-GX30 (199,99 €), el Mobvoi TicHome Mini (79,99 €), el LG ThinQ WK7 (199,99 €) y el altavoz Bluetooth inteligente con voz de Best Buy (59,99 €). El hecho de que tantos jugadores importantes en el espacio de los altavoces y auriculares estén lanzando hardware habilitado para la IA de Google en diferentes puntos de precio dice mucho sobre quién está saliendo adelante en el espacio del asistente de IA.
Cortana
La IA de Microsoft, Cortana, viene de serie en las máquinas de Windows, pero también está disponible para su descarga en Android e iOS. Cortana está disponible en el altavoz Harman Kardon Invoke with Cortana, de 199,95 dólares, y aunque hace tiempo que se rumorea la existencia de altavoces HP y Xiaomi con Cortana, no hay pruebas concretas de que esos altavoces sigan en marcha. Está por ver si Cortana estará disponible en otros altavoces de terceros o no, pero parece que el asistente de IA de Microsoft está perdiendo tracción frente a una competencia más sofisticada, al menos para el mercado de consumo.
En el Microsoft Build 2018, el gigante tecnológico desveló su largamente prometida integración con Amazon Alexa. La asociación entre Amazon y Microsoft sugiere que puede ser pronto para contar con Cortana fuera del juego por completo, especialmente si sigue centrándose principalmente en el mercado empresarial y no en el uso doméstico.
Alexa
El asistente inteligente de Amazon es accesible a través de la línea de altavoces Amazon Echo, así como a través de la línea de tabletas Fire y Fire TV de Amazon. De todos los asistentes de IA, Alexa está disponible en la más amplia variedad de dispositivos en términos de diseño. Mientras que el asistente de IA de Google se puede encontrar en un montón de altavoces, todos tienen un aspecto similar. Amazon, por su parte, vende docenas de diseños con Alexa, incluyendo altavoces de todos los tamaños, así como altavoces de aspecto moderno con pantallas táctiles brillantes.
También hay algunos altavoces inteligentes de terceros y otros dispositivos compatibles con Alexa, como el altavoz inalámbrico Sonos (199,99 dólares), los altavoces Ultimate Ears Megablast (199,99 dólares), los altavoces Altec Lansing VersA Smart Portable (99,99 dólares) y la cámara Garmin Speak Plus Dash (179,99 dólares). También hay una app de Alexa, pero la aplicación está pensada principalmente como un complemento de otro dispositivo Alexa y no como un asistente de IA independiente.
Siri
Puedes acceder a Siri en casi cualquier dispositivo de Apple, incluyendo su línea de portátiles, ordenadores de sobremesa, teléfonos y tabletas, y smartwatches. Apple también vende su propio altavoz, el HomePod (349 dólares), y parece que el acceso de terceros está en camino. Sonos, una empresa que produce y vende altavoces domésticos de gama alta, afirma que desplegará una actualización de software en julio que permitirá a los usuarios acceder a Siri (además de a Alexa y al Asistente de Google).
Facilidad de configuración
La facilidad de configuración se refiere a cuánto tiempo se tarda en poner en marcha el asistente, así como a lo complicado que es ese proceso. Todos los asistentes de IA que evalué tienen opciones para personalizar la experiencia del asistente personal, incluyendo la integración de la app, los ajustes personalizados y las respuestas adaptativas.
Para mantener un terreno de pruebas parejo, no tuve en cuenta los pasos de configuración adicionales que entran en la categoría de personalización; solo consideré cuánto tardaría un nuevo usuario en encender el dispositivo y empezar a hacer preguntas. Tanto Google Assistant como Siri y Alexa no requirieron prácticamente ningún tiempo de configuración (basta con conectarse a una red y empezar) y fueron completamente intuitivos. Ninguno de estos tres necesitó más de unos 45 segundos para el acceso inicial, y eso incluía encender el dispositivo o, en el caso de Alexa, enchufarlo.
Cortana es una historia diferente. Si quieres acceder a las funciones de voz de Cortana, que es de lo que se trataba en esta prueba, debes acceder a ella en tu dispositivo y luego iniciar sesión; ah, y no puedes usar una dirección de correo electrónico del trabajo o de la escuela para el inicio de sesión. Una vez que introduces una cuenta de correo electrónico aceptable, esperas un código de verificación e introduces el código, crees que estás en el negocio, pero no lo estás.
En última instancia, inicié sesión con éxito descargando la aplicación de Cortana e iniciando sesión en mi teléfono. Pero cuando haces eso, Cortana no te permite iniciar sesión con tu número de teléfono (aunque dice que es una opción) porque «no es una cuenta de Windows.» Tampoco puedes iniciar sesión con tu nombre, solo con tu dirección de correo electrónico que no es de trabajo ni de la escuela.
Después de iniciar sesión con mi dirección de correo electrónico, Cortana se dirigió alegremente a mí por eso, mi dirección de correo electrónico completa (punto-com incluido), durante el resto de nuestras conversaciones, pero al menos empezó a funcionar. Esperemos que el proceso de configuración sea más fácil para los altavoces Harman Kardon que contarán con Cortana cuando finalmente debuten.
Reconocimiento de voz
Para el reconocimiento de voz, todo lo que quería saber era la frecuencia con la que el asistente virtual podía reconocer las palabras que yo decía. No tuve en cuenta el contexto ni el valor de la respuesta que me daban, sólo el reconocimiento básico. Probé el reconocimiento de voz a varias distancias de los dispositivos, con distintos niveles de ruido de fondo.
Google y Siri me entendieron bien cuando la habitación en la que estaba era tranquila y yo estaba cerca de los dispositivos. Hubo un par de malentendidos graciosos, como cuando le pregunté a Siri: «¿Cuál es la fecha para dentro de cuatro semanas?» y me dio la fecha para dentro de una semana, porque confundió «cuatro» con «para» y «semanas» con «semana» y pensó que estaba diciendo: «¿Cuál es la fecha para dentro de una semana?». Con todo, el reconocimiento de voz era impresionante en condiciones ideales.
Sin embargo, una vez que usé Google o Siri para hacer algo relacionado con el sonido, como leer un artículo de noticias o reproducir música, los asistentes ya no podían oírme hablar a un volumen normal. Grité literalmente, y finalmente Google me escuchó, pero Siri no me oyó ni siquiera entonces. De hecho, tuve que desactivar manualmente el sonido en el iPhone para que Siri dejara de reproducir las noticias, lo que en cierto modo anula el propósito del manos libres.
El reconocimiento de voz de Alexa era irregular. Al igual que Google y Siri, no pudo entenderme en absoluto cuando había incluso música suave reproduciéndose, y tuve que apagar manualmente el altavoz para que dejara de reproducir música. A diferencia de los otros dos asistentes, Alexa también tuvo problemas para entender preguntas básicas, incluso cuando la habitación estaba en silencio excepto por mis comandos de voz.
Pedí repetidamente ayuda para conseguir billetes de avión, y cada vez Alexa pensó que estaba pidiendo entradas de cine y me dirigió a Fandango. Cuando le pregunté por fechas futuras («¿Cuál es la fecha para dentro de una semana?»), se limitó a responder: «Lo siento, no lo sé», mientras que otros asistentes no tuvieron problemas para entender preguntas con frases idénticas.
Cortana fue la que peor funcionó, con diferencia, en el reconocimiento de voz básico. El asistente de Microsoft tuvo problemas para entenderme incluso sin interferencias de ruido. Estos son algunos ejemplos de consultas básicas que Cortana no pudo entender, incluso cuando las dijo lenta y claramente sin ruido de fondo:
- Cancelar esta tarea.
- Quiero establecer un recordatorio.
- ¿Vende Amazon papel para impresora?
- Necesito ayuda para encontrar un restaurante.
- ¿Tengo algún recordatorio próximamente?
- ¿Cuánto son 5 dólares en euros? Y en yenes?
- ¿Dónde hay un Applebee’s cerca de mí? Se puede hacer una reserva?
- ¿Cuánto tardaré en llegar al aeropuerto de LaGuardia en coche? Qué tal en metro?
Los otros tres asistentes podían entender todas estas consultas, y Cortana entendía algunas de las que yo hacía (como las relativas al tiempo), así que no era un problema de micrófono.
Aprovechamiento de las consultas y capacidad para entender el contexto
El valor de un asistente de IA reside en su capacidad para entender el lenguaje natural y el contexto y ofrecer una respuesta útil. Para poner a prueba esta habilidad, ideé preguntas con seguimientos dependientes del contexto. Estas son algunas de las preguntas que hice a cada uno de los asistentes:
También le pregunté a cada uno de los asistentes una lista de preguntas comunes sobre programación, configuración de recordatorios, compras en línea, reserva de alojamiento para viajes y obtención de direcciones.
Cortana
Desgraciadamente, Cortana se eliminó efectivamente de la carrera porque ni siquiera podía oírme o entenderme a un nivel básico. Cuando Cortana sí me entendía, no respondía de forma intuitiva o útil. Por ejemplo, cuando le pedí indicaciones para llegar al aeropuerto más cercano, buscó durante casi un minuto entero y luego volvió con una lista de resultados de Bing, que en su mayoría enlazaban con sitios web generales de billetes de avión como Expedia.
Cuando le pedí a Cortana que tradujera de dólares a yenes, algo que los otros tres asistentes hicieron con facilidad, no respondió en voz alta sino que sacó una página de Bing con una lista de respuestas generales sobre el cambio de divisas de Answers.com. Cada vez que hacía preguntas de seguimiento, especialmente las que dependían del contexto, Cortana no respondía en absoluto, me decía que no lo sabía o me dirigía a permitir los permisos de una aplicación de terceros.
Aunque se pueden integrar aplicaciones de terceros con Cortana (como se puede hacer con todos los asistentes), mi opinión es que el proceso para hacerlo es, en el mejor de los casos, largo. En general, Cortana parece una forma de Bing cosas en voz alta y luego recibir respuestas en su computadora portátil, en lugar de un asistente virtual de pleno derecho para los negocios.
Alexa
Alexa funcionó bien al responder a las preguntas básicas, especialmente las que se referían a la compra de artículos en Amazon y el establecimiento de recordatorios. Sin embargo, cuando fui bajando en la lista y llegué a preguntas más complicadas, que requerían contexto o mucha atención a los detalles, Alexa flaqueó. Intenté varias veces que Alexa me ayudara a comprar billetes de avión, pero el asistente me remitió constantemente a Fandango para comprar entradas de cine. Rara vez respondió a las preguntas de seguimiento en absoluto, y cuando lo hizo, fue a menudo con un cortés pero poco útil «Lo siento, no sé eso».
En general, Alexa podía hacer parte de cada tarea que le pedí. Por ejemplo, podía decirme dónde estaba el Applebee’s más cercano, pero no podía hacer una reserva. Podía decirme cuánto costaban 5 dólares en euros, pero cuando le pregunté «¿Y en yenes?» no lo supo. Cuando le pregunté cuánto tardaría en llegar al aeropuerto de LaGuardia, me dijo: «Como no conozco tu velocidad, no puedo decirte cuánto tardarás»
Alexa parece basarse en una terminología muy específica para los comandos. Por ejemplo, cuando le pedí que me leyera las noticias, lo hizo, pero no pude conseguir que se detuviera. Intenté todas las órdenes directas posibles que se me ocurrieron para que dejara de leer las noticias, incluyendo «parar» y «apagar el volumen», pero la única frase que funcionó (que tuve que buscar en Internet) fue «detener la sesión informativa de flash», que no es precisamente intuitiva. Era fácil configurar recordatorios con Alexa, pero cuando llegaba la hora del recordatorio, Alexa se limitaba a hacer sonar una alarma, sin indicación de para qué era la alarma, y tenía que apagar la alarma manualmente.
Alexa es una herramienta aceptable para hacer pedidos en Amazon, y puede ser buena para la integración de casas inteligentes, pero no es la mejor IA para el uso del lenguaje natural. Cualquiera que adopte el Alexa debería leer detenidamente las guías de usuario antes de configurarlo y entender sus limitaciones.
Google Assistant vs. Siri
Merece la pena comparar la capacidad de Google Assistant y Siri para entender el contexto y el habla intuitiva, porque estos dos asistentes están codo con codo en la facilidad de uso y la inteligencia.
Cuando pedí indicaciones para llegar al One World Trade Center, tanto Google Assistant como Siri respondieron con instrucciones de conducción claras. Cuando añadí una pregunta de seguimiento sobre las direcciones de transporte público en su lugar, Google Assistant respondió verbalmente con direcciones hacia y desde el metro, así como un enlace automático a la instrucción paso a paso en Google Maps. Desgraciadamente, Siri se limitó a encontrarme indicaciones alternativas para llegar en coche. No importaba cómo se lo pidiera, no pude conseguir que Siri me diera indicaciones sobre el transporte público.
Siri superó a Google Assistant en tareas como encontrar restaurantes específicos y hacer reservas. De hecho, Siri fue el único asistente que probé que no solo pudo encontrar un restaurante cercano (algo que también hizo Google Assistant), sino también hacer una reserva por mí. Cuando le pedí a Google Assistant que encontrara un restaurante específico, lo hizo, pero cuando le pedí que hiciera una reserva por mí, inexplicablemente me llevó a DisneyWorld.com. Intenté varias veces hacer una reserva a través de Google Assistant, y simplemente no ocurría. Por cierto, tampoco consiguió convencerme para que reservara unas vacaciones en Disney.
La posibilidad de hacer reservas de restaurantes con manos libres con Siri podría ser una verdadera bendición para los usuarios de negocios que quieran utilizar sus asistentes de IA para uso empresarial y personal. Sin embargo, se queda corto si no eres específico en tus peticiones. Por ejemplo, cuando simplemente dije: «Necesito ayuda para encontrar un restaurante», Siri respondió con una lista de resultados de Google que eran literalmente instrucciones sobre cómo encontrar un restaurante, mientras que el Asistente de Google leyó entre líneas y me mostró restaurantes cercanos.
El Asistente de Google también fue mejor que Siri para la información de viajes, pero todavía no fue perfecto en el seguimiento. Cuando le pregunté a Siri por los vuelos de Nueva York a París, simplemente buscó en Google mi pregunta y me mostró las respuestas. Cuando le pregunté a Google Assistant por vuelos de Nueva York a París, me pidió las fechas y empezó a sacar las reservas disponibles; sin embargo, cuando intenté ir hasta el final y reservar los vuelos, simplemente dijo «¡No hay problema!» y luego no hizo nada. Una cosa interesante que me ofreció Google Assistant, sin pedirlo, fue la posibilidad de enviarme un correo electrónico si los precios cambiaban en los vuelos que me interesaban.
Cuando le pedí a los asistentes que me leyeran las noticias, Google Assistant empezó a reproducir inmediatamente un podcast reciente de NPR, mientras que Siri buscó en Google varias fuentes de noticias por mí. Observé a lo largo de muchas tareas diferentes que Siri rara vez me respondía en voz alta, mientras que Google Assistant casi siempre lo hacía. Aunque es probable que se trate de una cuestión de jugar con algunos ajustes, es una diferencia interesante que hay que tener en cuenta.
Finalidad
Ninguno de los asistentes de IA es perfecto; se trata de una tecnología joven, y tiene un largo camino por recorrer. Hubo un puñado de preguntas que ninguno de los asistentes virtuales de mi lista pudo responder. Por ejemplo, cuando pedí indicaciones para llegar al aeropuerto más cercano, incluso los dos mejores asistentes de mi lista, Google Assistant y Siri, fallaron de forma hilarante: Google Assistant me dirigió a una agencia de viajes (¿todavía existen?), mientras que Siri me dirigió a una base de hidroaviones (¡tan cerca!).