Zukunft von Sprachassistenten

„Alexa, warum kannst Du so wenig?“

15:34 Minuten
Nahaufnahme eines dunkelblauen Lautsprechers der Marke Echo Dot mit der Sprachassistenz Alexa von Amazon vor schwarzem Hintergrund.
Bisher fehle den Sprachassistenten ein „Killer-Feature“, eine Funktion, die den Nutzern einen großen Mehrwert bietet. Im Bereich Sprache seien die Möglichkeiten noch lange nicht ausgeschöpft, meint Ingo Siegert. © unsplash / Reet Talreja
26.11.2022
Audio herunterladen
Schlicht und befehlsorientiert statt interaktiv: Sprachassistenten wie Siri, Cortana oder Alexa sind bisher nicht mehr als bessere Fernbedienungen und für die Konzerne ein großes Verlustgeschäft. Doch in der Technologie liegt großes Potenzial.
"Ein Leben ohne Smartspeaker ist möglich, aber sinnlos" dachten wir lange euphorisch: Die kleinen sprechenden Lautsprecher von Google, Amazon, Apple oder Microsoft können einfach alles für uns regeln. Wir ließen uns von ihnen wecken und an Termine erinnern. Sie sollten auf Zuruf Musik spielen und beim Kochen mit Rezepten und Einkaufslisten helfen. Die Erwartungen waren hoch.

Amazon-Mitarbeiter berichten von Verlusten

Doch inzwischen macht sich Ernüchterung breit. Vor allem finanziell. Und vor allem bei Amazons Alexa. Laut dem Onlinemagazin Business Insider berichten interne Quellen, dass die Sparte allein in diesem Jahr zehn Milliarden Dollar Verlust machen werde. Im Zuge dessen sei Amazon dabei, 10.000 Mitarbeiter aus dem Bereich zu entlassen.
Ist die Technologie schon am Ende? Zumindest ist sie noch lange nicht da, wo sie sein könnte.
„Ich glaube, wir haben uns alle unbewusst vorgestellt, dass wir nach Hause kommen und von einem intelligenten Sprachsystem begrüßt werden, das uns die Nachrichten vorliest und proaktiv mit uns kommuniziert. Das ist eben nicht der Fall“, sagt der Digitalexperte Felix Beilharz.

Schlicht, einseitig, befehlsorientiert

Stattdessen nutzen wir die Assistenten für einfache Funktionen, die zum Beispiel auch Schalter erledigen können. Im Moment seien sie also „immer noch so etwas wie eine bessere Fernbedienung“, sagt Ingo Siegert vom Institut für Informations- und Kommunikationstechnik an der Universität Magdeburg.
Doch selbst diese einfachen Eingaben bringen Hürden mit sich. Für Alexa beispielsweise gibt es etwa 300 wichtige Befehle, die man erst mal lernen muss.
„Wenn andere Personen mit im Raum sind, stört man natürlich mit seinen Sprachbefehlen. Das andere ist, beobachte ich selber, wenn man Sprachbefehle hat, dass die von den Maschinen dann teilweise doch nicht ganz verstanden werden und man sie wiederholen muss“, erklärt der Smart-Home-Experte Christoph Strobel.

„Zum einen sind die Geräte einfach nicht so schlau, wie sie sein müssten, damit wir wirklich einen Nutzen davon haben. Und die Hürde ist dann auch recht hoch: Ich muss einen Skill aktivieren in der App. Also, das ist nicht so nahtlos und reibungslos, wie es eigentlich sein müsste.“

Digitalexperte Felix Beiharz

Beim Diktieren von Nachrichten verstehen smarte Assistenten statt „manuell“ gern „Manuel“ und aus „man nutzt“ wird schnell mal „Mammuts“.  Für deutsch eingestellte Systeme sind auch englische Musiktitel schwer zu erfassen.

Es fehlt ein "Killer-Feature"

„Aber es wäre überhaupt kein Problem, da den Assistenten zu verbessern, indem man Teile des Titels einfach buchstabieren oder die Melodie pfeifen könnte“, erklärt der Wissenschaftler Ingo Siegert.

„Die ganzen Vorteile, die es eigentlich bringt, natürlich sprachlich mit Geräten zu interagieren, also komplexere Anfragen zu stellen und so eine dialogische Interaktion zu haben, die finden nicht statt.“

Ingo Siegert vom Institut für Informations- und Kommunikationstechnik, Universität Magdeburg

Dass die Hersteller an diesen Schwierigkeiten nicht arbeiten, habe vor allem ökonomische Ursachen: „Weil sich wahrscheinlich für die kommerziellen Hersteller der Aufwand nicht lohnt. Weil die eher daran interessiert sind, was zu verkaufen oder ihr Ökosystem weiter verbreiten zu können“, sagt Ingo Siegert.
Bisher fehle den Sprachassistenten ein „Killer-Feature“, eine Funktion, die den Nutzern einen großen Mehrwert bietet. Im Bereich Sprache seien die Möglichkeiten noch lange nicht ausgeschöpft, denkt Ingo Siegert: „Weil, glaube ich, immer noch zu viel aus der Richtung gedacht wird: Ich muss das einsetzen, um mit Sprache Befehle zu geben. Aber eigentlich ist Sprache ja viel mehr.“
Mehr zum Thema