KI-Vergleich: Siri vs. Cortana vs. Google Assistant vs. Alexa

Als KI-Assistenten zum ersten Mal auf den Markt kamen, waren sie bei weitem nicht allgegenwärtig, aber dank mehr OEMs von Drittanbietern, die auf den Smart-Speaker-Zug aufgesprungen sind, gibt es mehr Auswahl für assistentenfähige Geräte als je zuvor. Neben der zunehmenden Vielfalt in Bezug auf die Hardware werden Geräte, die mehrere Arten von KI-Assistenten unterstützen, immer häufiger. Um Ihnen Zeit und Frustration zu ersparen, haben wir einen ausführlichen Praxistest durchgeführt – nicht um Lautsprecher gegeneinander zu vergleichen, sondern die KI-Assistenten selbst.

Es gibt vier Spitzenreiter im Bereich der KI-Assistenten: Amazon (Alexa), Apple (Siri), Google (Google Assistant) und Microsoft (Cortana). Anstatt die Effizienz der einzelnen Assistenten anhand der von den Unternehmen angegebenen Funktionen zu beurteilen, habe ich Stunden damit verbracht, jeden Assistenten zu testen, indem ich Befehle erteilte und Fragen stellte, die viele Geschäftsanwender verwenden würden. Ich habe Fragen konstruiert, um sowohl das grundlegende Verständnis als auch das kontextbezogene Verständnis und die allgemeine Spracherkennung zu testen.

Erreichbarkeit und Trends

Die Erreichbarkeit bezieht sich darauf, auf wie vielen Geräten der virtuelle Assistent läuft. Am besten misst man die KI-Assistenten in dieser Kategorie aneinander, indem man sie einzeln betrachtet. Sie werden von am zugänglichsten bis am wenigsten zugänglich aufgelistet.

Google Assistant

Google Assistant ist auf allen Android- und iOS-Geräten sowie auf Chromebooks verfügbar. Google hat eine eigene Linie von Google Home-Lautsprechern, einschließlich Google Home Mini (49 US-Dollar), Google Home (129 US-Dollar) und Google Home Max (399 US-Dollar), die alle für die Verwendung mit Google Assistant ausgelegt sind. Google macht es auch einfach, nach Google AI-fähigen Lautsprechern von Drittanbietern zu suchen, wie dem Harman JBL Link 10 (99,99 $), Sony LF-S50G (199,99 $), Panasonic SC-GA10 (249,99 $), Onkyo VC-GX30 (199,99 $), Mobvoi TicHome Mini (79,99 $), LG ThinQ WK7 (199,99 $) und Best Buy Insignia Voice Smart Bluetooth Speaker (59,99 $). Die Tatsache, dass so viele große Anbieter von Lautsprechern und Kopfhörern Google-KI-fähige Hardware zu unterschiedlichen Preisen auf den Markt bringen, spricht Bände darüber, wer im Bereich der KI-Assistenten die Nase vorn hat.

Cortana

Microsoft’s KI, Cortana, ist standardmäßig auf Windows-Geräten enthalten, steht aber auch für Android und iOS zum Download bereit. Cortana ist auf dem 199,95 US-Dollar teuren Harman Kardon Invoke with Cortana-Lautsprecher verfügbar, und obwohl es schon länger Gerüchte über Cortana-fähige Lautsprecher von HP und Xiaomi gibt, gibt es keine konkreten Hinweise darauf, dass solche Lautsprecher noch in Arbeit sind. Ob Cortana auf anderen Lautsprechern von Drittanbietern verfügbar sein wird oder nicht, bleibt abzuwarten, aber es sieht so aus, als ob der KI-Assistent von Microsoft angesichts der anspruchsvolleren Konkurrenz an Zugkraft verliert, zumindest für den Verbrauchermarkt.

Auf der Microsoft Build 2018 enthüllte der Tech-Riese seine lang versprochene Integration mit Amazon Alexa. Die Partnerschaft zwischen Amazon und Microsoft deutet darauf hin, dass es zu früh ist, Cortana ganz aus dem Spiel zu nehmen, vor allem, wenn sie sich weiterhin hauptsächlich auf den Unternehmensmarkt und nicht auf den Heimgebrauch konzentriert.

Alexa

Amazons intelligente Assistentin ist über die Amazon Echo-Lautsprecherreihe sowie über Amazons Fire-Tablets und Fire TV zugänglich. Von allen KI-Assistenten ist Alexa in Bezug auf das Design auf den unterschiedlichsten Geräten verfügbar. Während Googles KI-Assistent auf vielen Lautsprechern zu finden ist, sehen sie alle ähnlich aus. Amazon hingegen verkauft Dutzende von Alexa-fähigen Designs, darunter Lautsprecher in allen Größen sowie modern aussehende Lautsprecher mit glänzenden Touchscreens.

Es gibt auch einige Smart-Lautsprecher und andere Geräte von Drittanbietern, die Alexa unterstützen, darunter der kabellose Sonos-Lautsprecher (199,99 US-Dollar), die Ultimate Ears Megablast-Lautsprecher (199,99 US-Dollar), die Altec Lansing VersA Smart Portable-Lautsprecher (99,99 US-Dollar) und die Garmin Speak Plus Dash Camera (179,99 US-Dollar). Es gibt auch eine Alexa-App, aber die App ist in erster Linie als Ergänzung zu einem anderen Alexa-Gerät gedacht und nicht als eigenständiger KI-Assistent.

Siri

Sie können auf Siri auf fast jedem Apple-Gerät zugreifen, einschließlich seiner Reihe von Laptops, Desktops, Telefonen und Tablets sowie Smartwatches. Apple verkauft auch seinen eigenen Lautsprecher, den HomePod (349 Dollar), und es sieht so aus, als ob der Zugriff von Drittanbietern auf dem Weg ist. Sonos, ein Unternehmen, das High-End-Heimlautsprecher herstellt und vertreibt, behauptet, dass es im Juli ein Software-Update herausbringen wird, das es Nutzern ermöglicht, auf Siri zuzugreifen (zusätzlich zu Alexa und Google Assistant).

Einfache Einrichtung

Einfache Einrichtung bezieht sich darauf, wie lange es dauert, den Assistenten zum Laufen zu bringen, und wie kompliziert dieser Prozess ist. Alle von mir untersuchten KI-Assistenten verfügen über Optionen zur Anpassung des persönlichen Assistenten-Erlebnisses, darunter App-Integration, benutzerdefinierte Einstellungen und adaptive Antworten.

Um ein gleichmäßiges Testfeld zu erhalten, habe ich zusätzliche Einrichtungsschritte, die unter die Kategorie der Anpassung fallen, nicht berücksichtigt; ich habe nur betrachtet, wie lange ein neuer Benutzer brauchen würde, um das Gerät einzuschalten und Fragen zu stellen. Google Assistant, Siri und Alexa benötigten alle praktisch keine Einrichtungszeit (man meldet sich einfach bei einem Netzwerk an und kann loslegen) und waren vollkommen intuitiv. Keines dieser drei Geräte benötigte mehr als 45 Sekunden für den ersten Zugriff, und dazu gehörte auch das Einschalten des Geräts oder, im Fall von Alexa, das Anschließen an die Steckdose.

Cortana ist eine andere Geschichte. Wenn Sie auf die Sprachfunktionen von Cortana zugreifen möchten, worum es in diesem Test ging, müssen Sie auf Ihrem Gerät darauf zugreifen und sich dann anmelden – oh, und Sie können keine Arbeits- oder Schul-E-Mail-Adresse für die Anmeldung verwenden. Sobald Sie ein akzeptables E-Mail-Konto eingeben, auf einen Verifizierungscode warten und den Code eingeben, denken Sie, dass Sie im Geschäft sind, aber Sie sind es nicht.

Schließlich habe ich mich erfolgreich angemeldet, indem ich die Cortana-App heruntergeladen und mich auf meinem Telefon angemeldet habe. Aber wenn Sie das tun, erlaubt Cortana Ihnen nicht, sich mit Ihrer Telefonnummer anzumelden (obwohl es behauptet, dass das eine Option ist), weil es „kein Windows-Konto ist.“ Sie können sich auch nicht mit Ihrem Namen anmelden, sondern nur mit Ihrer Nicht-Arbeits- und Nicht-Schul-E-Mail-Adresse.

Nachdem ich mich mit meiner E-Mail-Adresse angemeldet hatte, sprach mich Cortana für den Rest unserer Unterhaltungen fröhlich mit dieser Adresse an (einschließlich dot-com), aber zumindest funktionierte es. Hoffentlich wird der Einrichtungsprozess für die Harman-Kardon-Lautsprecher, die mit Cortana ausgestattet sein werden, einfacher, wenn sie endlich auf den Markt kommen.

Spracherkennung

Für die Spracherkennung wollte ich nur wissen, wie oft die virtuelle Assistentin die Wörter erkennen kann, die ich sage. Ich berücksichtigte nicht den Kontext oder den Wert der Antwort, die ich erhielt, sondern nur die grundlegende Erkennung. Ich testete die Spracherkennung in verschiedenen Entfernungen zu den Geräten und mit unterschiedlichen Hintergrundgeräuschen.

Google und Siri verstanden mich gut, wenn der Raum, in dem ich mich befand, ruhig war und ich nahe an den Geräten war. Es gab ein paar lustige Missverständnisse, z. B. als ich Siri fragte: „Welches Datum haben wir in vier Wochen?“ und sie mir das Datum für eine Woche später gab, weil sie „vier“ mit „für“ und „Wochen“ mit „Woche“ verwechselte und dachte, ich würde sagen: „Welches Datum haben wir in einer Woche von jetzt an?“ Alles in allem war die Spracherkennung unter idealen Bedingungen jedoch beeindruckend.

Sobald ich jedoch Google oder Siri für etwas Tonbezogenes benutzte, wie das Lesen eines Nachrichtenartikels oder das Abspielen von Musik, konnten die Assistenten mich nicht mehr hören, wenn ich in normaler Lautstärke sprach. Ich schrie förmlich, und schließlich hörte mich Google, aber Siri hörte mich auch dann nicht. Tatsächlich musste ich den Ton auf dem iPhone manuell ausschalten, damit Siri aufhörte, die Nachrichten abzuspielen, was irgendwie den Zweck der Freisprecheinrichtung zunichte macht.

Alexas Spracherkennung war fleckig. Wie Google und Siri konnte sie mich überhaupt nicht verstehen, wenn auch nur leise Musik lief, und ich musste den Lautsprecher manuell ausschalten, damit er aufhörte, Musik zu spielen. Im Gegensatz zu den anderen beiden Assistenten hatte Alexa auch Probleme, grundlegende Fragen zu verstehen, selbst wenn der Raum bis auf meine Sprachbefehle still war.

Ich bat wiederholt um Hilfe bei der Beschaffung von Flugtickets, und jedes Mal dachte Alexa, ich würde nach Kinokarten fragen und verwies mich an Fandango. Als ich nach zukünftigen Terminen fragte („Welcher Termin ist in einer Woche?“), antwortete sie einfach: „Tut mir leid, das weiß ich nicht“, während andere Assistenten keine Probleme hatten, identisch formulierte Fragen zu verstehen.

Cortana schnitt bei der einfachen Spracherkennung mit Abstand am schlechtesten ab. Microsofts Assistent hatte sogar bei Null Störgeräuschen Probleme, mich zu verstehen. Hier sind nur ein paar Beispiele für einfache Anfragen, die Cortana nicht verstehen konnte, selbst wenn sie langsam und deutlich und ohne Hintergrundgeräusche ausgesprochen wurden:

  • Diese Aufgabe abbrechen.
  • Ich möchte eine Erinnerung setzen.
  • Verkauft Amazon Druckerpapier?
  • Ich brauche Hilfe bei der Suche nach einem Restaurant.
  • Haben Sie eine Erinnerung für mich geplant?

Die anderen drei Assistenten konnten alle diese Anfragen verstehen, und Cortana verstand einige meiner Anfragen (z. B. die zum Wetter), es war also kein Mikrofonproblem.

Erfolg von Anfragen und Fähigkeit, Kontext zu verstehen

Der Wert eines KI-Assistenten liegt in seiner Fähigkeit, natürliche Sprache und Kontext zu verstehen und eine nützliche Antwort zu liefern. Um diese Fähigkeit zu testen, habe ich mir Fragen mit kontextabhängigen Folgefragen ausgedacht. Hier sind ein paar Fragen, die ich jedem der Assistenten gestellt habe:

  • Wie viel sind 5 Dollar in Euro? Wie sieht es in Yen aus?
  • Wo gibt es ein Applebee’s in meiner Nähe? Können Sie eine Reservierung machen?
  • Wie lange brauche ich mit dem Auto zum LaGuardia Airport? Wie wäre es mit der U-Bahn?

Ich habe jedem der Assistenten auch eine Reihe von allgemeinen Fragen zur Terminplanung, zum Einstellen von Erinnerungen, zum Online-Shopping, zur Buchung von Reiseunterkünften und zur Wegbeschreibung gestellt.

Cortana

Unglücklicherweise hat sich Cortana selbst aus dem Rennen genommen, weil sie mich nicht einmal auf einer grundlegenden Ebene hören oder verstehen konnte. Wenn Cortana mich verstand, reagierte sie nicht auf eine Weise, die intuitiv oder hilfreich war. Als ich zum Beispiel nach einer Wegbeschreibung zum nächstgelegenen Flughafen fragte, suchte sie fast eine ganze Minute lang und kam dann mit einer Ergebnisliste von Bing zurück, die meist auf allgemeine Flugticket-Websites wie Expedia verlinkte.

Als ich Cortana bat, von USD in Yen zu übersetzen, was alle anderen drei Assistenten mit Leichtigkeit taten, antwortete sie nicht laut, sondern rief eine Seite von Bing mit einer Liste allgemeiner Antworten zum Währungswechsel von Answers.com auf. Jedes Mal, wenn ich Folgefragen stellte, insbesondere solche, die vom Kontext abhängen, antwortete Cortana entweder gar nicht, sagte mir, dass sie es nicht weiß, oder wies mich an, Berechtigungen von einer App eines Drittanbieters zuzulassen.

Während man Apps von Drittanbietern in Cortana integrieren kann (wie bei allen Assistenten), ist der Prozess dafür meiner Einschätzung nach bestenfalls langwierig. Im Allgemeinen scheint Cortana eher eine Möglichkeit zu sein, Dinge laut zu sagen und dann Antworten auf Ihrem Laptop zu erhalten, als ein vollwertiger virtueller Assistent für das Geschäft.

Alexa

Alexa funktionierte gut bei der Beantwortung grundlegender Fragen, besonders bei denen, die sich auf den Kauf von Artikeln auf Amazon und das Einstellen von Erinnerungen bezogen. Als ich mich jedoch in der Liste nach unten arbeitete und zu komplizierteren Fragen kam, die Kontext oder Detailgenauigkeit erforderten, strauchelte Alexa. Ich habe mehrmals versucht, Alexa dazu zu bringen, mir beim Kauf von Flugtickets zu helfen, aber der Assistent verwies mich immer wieder an Fandango, um Kinokarten zu kaufen. Sie beantwortete nur selten Folgefragen, und wenn, dann oft mit einem höflichen, aber wenig hilfreichen „Sorry, das weiß ich nicht.“

Im Allgemeinen konnte Alexa einen Teil der Aufgaben erledigen, die ich ihr stellte. Zum Beispiel konnte sie mir sagen, wo das nächste Applebee’s ist, aber sie konnte keine Reservierung machen. Sie konnte mir sagen, wie viel $5 in Euro sind, aber als ich nachfragte: „Was ist mit Yen?“, wusste sie es nicht. Als ich fragte, wie lange ich für die Fahrt zum Flughafen LaGuardia brauchen würde, sagte es: „Da ich Ihre Geschwindigkeit nicht kenne, kann ich Ihnen nicht sagen, wie lange das dauern wird.“

Alexa scheint sich bei Befehlen auf eine sehr spezifische Terminologie zu verlassen. Als ich sie zum Beispiel bat, mir die Nachrichten vorzulesen, tat sie das auch, aber ich konnte sie nicht dazu bringen, aufzuhören. Ich habe alle möglichen direkten Befehle ausprobiert, die mir einfielen, um das Vorlesen der Nachrichten zu stoppen, einschließlich „Stopp“ und „Lautstärke ausschalten“, aber die einzige Phrase, die funktionierte (die ich online nachschlagen musste), war „Flash-Briefing stoppen“, was nicht gerade intuitiv ist. Es war einfach, mit Alexa Erinnerungen einzurichten, aber wenn die Erinnerungszeit kam, schlug Alexa einfach einen Alarm, ohne Hinweis darauf, wofür der Alarm war, und ich musste den Alarm manuell ausschalten.

Alexa ist ein OK-Tool für Bestellungen bei Amazon, und es kann gut für die Smart-House-Integration sein, aber es ist nicht die beste KI für die Verwendung natürlicher Sprache. Jeder, der Alexa einführt, sollte vor der Einrichtung die Benutzerhandbücher lesen und die Grenzen der KI verstehen.

Google Assistant vs. Siri

Es lohnt sich, die Fähigkeit von Google Assistant und Siri, Kontext und intuitive Sprache zu verstehen, zu vergleichen, da diese beiden Assistenten in Sachen Benutzerfreundlichkeit und Intelligenz Kopf an Kopf liegen.

Als ich nach einer Wegbeschreibung zum One World Trade Center fragte, antworteten sowohl Google Assistant als auch Siri mit klaren Fahranweisungen. Als ich stattdessen eine Folgefrage nach einer Wegbeschreibung mit öffentlichen Verkehrsmitteln hinzufügte, antwortete Google Assistant verbal mit einer Wegbeschreibung zur und von der U-Bahn sowie einem automatischen Link zu einer Schritt-für-Schritt-Anleitung in Google Maps. Leider fand Siri für mich nur eine alternative Wegbeschreibung. Egal wie ich fragte, ich konnte Siri nicht dazu bringen, mir eine Wegbeschreibung für den öffentlichen Nahverkehr zu geben.

Siri übertraf Google Assistant bei Aufgaben wie der Suche nach bestimmten Restaurants und Reservierungen. Tatsächlich war Siri der einzige Assistent, den ich getestet habe, der nicht nur ein Restaurant in der Nähe finden konnte (was Google Assistant auch tat), sondern auch eine Reservierung für mich vornehmen konnte. Als ich Google Assistant bat, ein bestimmtes Restaurant zu finden, tat er das, aber als ich ihn bat, eine Reservierung für mich zu buchen, führte er mich unerklärlicherweise zu DisneyWorld.com. Ich habe mehrmals versucht, eine Reservierung über Google Assistant zu buchen, und es hat einfach nicht geklappt. Übrigens konnte er mich auch nicht davon überzeugen, einen Disney-Urlaub zu buchen.

Die Möglichkeit, mit Siri freihändig Restaurantreservierungen vorzunehmen, könnte ein echter Segen für Geschäftsanwender sein, die ihren KI-Assistenten für geschäftliche und private Zwecke nutzen möchten. Sie greift jedoch zu kurz, wenn man nicht spezifisch in seinen Anfragen ist. Als ich zum Beispiel einfach sagte: „Ich brauche Hilfe bei der Suche nach einem Restaurant“, antwortete Siri mit einer Liste von Google-Ergebnissen, die buchstäblich Anweisungen waren, wie man ein Restaurant findet, während Google Assistant zwischen den Zeilen las und mir Restaurants in der Nähe zeigte.

Google Assistant war auch besser als Siri für Reiseinformationen, aber es war immer noch nicht perfekt bei der Umsetzung. Als ich Siri nach Flügen von New York nach Paris fragte, googelte sie einfach meine Frage und zeigte mir die Antworten. Als ich Google Assistant nach Flügen von New York nach Paris fragte, fragte er mich nach Daten und begann, verfügbare Reservierungen aufzurufen; als ich jedoch versuchte, den ganzen Weg zu gehen und die Flüge zu buchen, sagte er einfach: „Kein Problem! Eine coole Sache, die Google Assistant mir ohne Aufforderung anbot, war die Möglichkeit, mir eine E-Mail zu schicken, wenn sich die Preise für die Flüge, an denen ich interessiert war, änderten.

Als ich die Assistenten bat, mir die Nachrichten vorzulesen, begann Google Assistant sofort, einen aktuellen NPR-Podcast abzuspielen, während Siri mehrere Nachrichtenquellen für mich googelte. Bei vielen verschiedenen Aufgaben fiel mir auf, dass Siri nur selten laut antwortete, während Google Assistant dies fast immer tat. Während dies wahrscheinlich eine Sache des Spielens mit ein paar Einstellungen ist, ist es ein interessanter Unterschied zu beachten.

Fazit

Keiner der KI-Assistenten ist perfekt; dies ist eine junge Technologie, und es hat einen langen Weg zu gehen. Es gab eine Handvoll Fragen, die keiner der virtuellen Assistenten auf meiner Liste beantworten konnte. Als ich zum Beispiel nach einer Wegbeschreibung zum nächstgelegenen Flughafen fragte, versagten sogar die beiden besten Assistenten auf meiner Liste, Google Assistant und Siri, auf lustige Weise: Google Assistant verwies mich an ein Reisebüro (gibt es die noch?), während Siri mich zu einer Wasserflugzeugbasis verwies (so nah!).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.