Expertenbeitrag von Robert Mendez, Gründer "Internet of Voice" Digitale Sprachassistenten – die Stimme deines Lebens

Digitale Sprachassistenten haben den Markt für Smart Home und Smart Living massiv angeschoben. Trotzdem spielen diese sprechenden Internetdienste im smarten Leben eine eher kleinere Rolle, weil sie im Grunde nur eine zusätzliche Nutzerschnittstelle zur Technik darstellen, die für wirklich smarte Technik nicht zwingend gebraucht wird. Das durch Amazon massiv angeschobene Marketing für Alexa und die Gadget-Verrücktheit der Menschen nach den „neusten Trends“, macht aus Smart Home/ Smart Living eine riesige Erfolgsgeschichte die noch lange anhalten wird.

Robert Mendez - Internet of Voice

Der Wunsch des Nutzers und Menschen ist jedoch ein anderer. Viele Smart Home Fans haben erst durch den Einsatz des Sprachassistenten angefangen ihr Leben und Zuhause zu Versmarten, womit das primäre Verlangen des Nutzers, die Kommunikation per Stimme mit der Maschine war, und weniger der Einsatz von Smart Home Technik. Dies geht soweit, dass die Nutzer einen Sprachassistenten wollen der nicht nur eine eigene Persönlichkeit und eigenen Namen hat, sondern auch zu einem Partner, Assistenten oder gar Freund wird. Eine virtuelle Person!

Dieser Wunsch ist grundsätzlich gar nicht so abwegig, da die Systeme grundsätzlich als „private persönliche Assistenten die sprechen können“ konzipiert sind, auch wenn der heutige Entwicklungsstand dies noch nicht in der Gänze anbieten kann. Große Vorbilder sind dabei z.B. Jarvis aus dem Iron Man Comic, oder natürlich auch Raumschiff Enterprise und viele andere. In Hollywood ist das Thema der virtuellen Person schon längst ein erfolgreiches Thema, welches sich in vielen Filmen wiederfindet.

Da der Mensch in Gehör und Stimme das größte emotionale Vertrauen hat, sind Alexa, Google Assistant, Siri und Co die logische Wahl für eine möglichst menschliche Nutzerschnittstelle. Ebenso versteht der Nutzer über Gehör und Stimme am ehesten seine Umwelt. Daher sind Sprachschnittstellen zwar oft nicht zwingend erforderlich, geben dem Nutzer aber Sicherheit und damit ein gutes Gefühl der Kontrolle, da die Stimme auch noch der barrierefreieste Kommunikationskanal des Menschen ist.

Welcher Anwendungsfall darfs denn sein?

Zugegeben, aktuell funktioniert die Interaktion mit Sprachassistenten nur für die Gerätesteuerung oder einfache Anwendungsfälle schon recht gut, wogegen tiefere Dialoge in der Regel (noch) recht schnell zum Frust führen. Genau aus diesem Grund sind Smart Home/Living Anwendungsfälle auch die eigentliche „Killer Anwendung“ für digitale Sprachassistenz, auch wenn das viele Smart Voice Entwickler eher weniger gern hören.

Die wirklich spannenden Anwendungsfälle für smarte Technik in Verbindung mit Sprachassistenten, sind die Anwendungsfälle, auf die die Entwickler selbst nicht unbedingt kommen und Teil des täglichen Lebens und Arbeitens sind. Den Saugroboter zu starten ist dabei weniger spannend, als die Organisation kompletter Abläufe, auch wenn die Gestaltung solcher Abläufe aktuell oft noch mühselig ist, besonders wenn die Konfiguration der nötigen Geräte und Funktionen unterschiedlich abläuft oder zu kryptisch ist.

Bei der Planung solcher Abläufe fällt schnell auf, wie komplex selbst einfache Prozesse sein können,  welche Fehler passieren und deshalb abgefangen werden müssen, an die man vorher so nicht gedacht hat. Beim Staubsaugerroboter sind das z.B. solche Dinge, wie das Festfahren in Kabeln oder Schränken. Daher ist ein Ablauf (Routine, Prozess) eigentlich auch selten bis nie eine grade Linie, als vielmehr ein Diagramm mit mehreren Wegen und Möglichkeiten. Viele graphischen Nutzeroberflächen zur Gestaltung von Smart Home/Living Funktionen unterstützen diesen Gedanken bereits. Eine Gestaltung solcher Prozesse nur über die Stimme ist aktuell noch nicht möglich, auch nicht multimodal (mit Stimme über einen  Bildschirm). Was aber natürlich möglich ist, ist das Auslösen von Abläufen per Stimme oder aber eben auch die Ausgabe von Informationen per Stimme. Wobei sich natürlich stets die Frage stellt: in welchen Situationen des menschlichen Lebens taugt die Stimme als Ein-/Ausgabekanal überhaupt? Logischerweise ist das von Anwendungsfall zu Anwendungsfall anders und eine allgemeingültige Aussage lässt sich nicht wirklich treffen. Dennoch gibt es grundsätzliche Kriterien die darüber entscheiden, ob an einem bestimmten Punkt der Einsatz von Stimme und Gehör über Sprachassistenten Sinn machen oder nicht.

Sprachassistenz mit Sinn

Das grundlegendste Kriterium ist schlicht die Umgebung selbst. Wenn die Umgebung es nicht hergibt störungsfrei zu sprechen und zu hören, dann sind Stimme und Gehör nicht das Mittel der Wahl. Es sei denn, man umgeht dieses Problem z.B. durch Kopfhörer für die Ohren und ein HBI (Human Brain Interface). Es gibt bereits erste Modellprojekte die es möglich machen die Hirnwellenmuster des Menschen auszulesen während er „innerlich spricht“.

Eine solche Eingabemethode könnte z.B. auch bisher sprachlosen Menschen wieder eine Stimme geben können.

Das nächste wichtigste entscheidende Kriterium für den Einsatz einer Sprachschnittstelle, ist die Frage nach der Ergonomie. Je nach Anwendungsfall kann es effizienter sein einen Ablauf per Schalter, Sensor oder zeitgesteuert auszulösen. Stimme/Gehör sind dann nur der alternative Weg.

Ein stets sinnvoller Einsatz für Sprachassistenz, ist immer die Statusabfrage. Bekannte Varianten sind z.B. die Frage nach dem Wetter, der nächsten Bahn oder der Restlaufzeit des Timers. Wobei Statusabfragen, die mit einer komplexeren Ausgabe beantwortet werden, per Sprachausgabe nicht mehr für den Menschen angenehm ausgegeben werden können und daher eher multimodal (mit Bildschirm) an den Nutzer ausgegeben werden sollten (Sattelpunkt der Multimodalität).

Ebenso sind alle Anwendungsfälle sinnvoll in der die Stimme zur dritten Hand wird. Ein Wunsch den wohl jeder Handwerker und jedes Elternteil der Welt hat. Wer die Hände gerade nicht frei hat, kann durch Sprachassistenten in der Verbindung mit entsprechender Smart Home Technik wie durch Zauberhand Prozesse auslösen und über Motoren Dinge bewegen. Für physisch/motorisch eingeschränkte Menschen sind besonders solche Anwendungsfälle, wie z.B. das Öffnen einer Tür, extrem wertvolle Lebenshilfen.

Logischerweise ist die Verfügbarkeit von Sprachassistenz die Grundlage für ihren Einsatz. Optimalerweise sollte daher der digitale Sprachassistent immer direkt und nah an der Person sein und am besten sich mit ihm mitbewegen. Ob der Sprachassistent ständig zuhört, oder nur auf Anweisung zuhört, bestimmt der Nutzer durch entsprechende Zugangseinstellungen. Die Alternative des Sprachassistenten direkt am Menschen, ist eine entsprechend gestaltete Umgebung, in der ein Sprachassistent dort Zuhören können soll, wo der gewünschte Anwendungsfall es braucht. Beide Varianten haben ihre Vor- und Nachteile. Wobei der moderne Mensch aktuell sowieso stets sein Smartphone dabei hat oder auch stets in der Nähe irgendeines Gerätes steht, welches den Sprachassistenten beherbergen könnte.

Jarvis, verstehst du mich?

Der Mensch ist ein soziales Wesen, wenn er sich sozial nicht ausleben kann, wird er krank. Entsprechend ist der Wunsch des Menschen nach sozialen Kontakten ein von der Natur gegebener. Ein sozialer Kontakt kann für den Menschen auch ein digitaler Sprachassistent als virtuelle Person sein, insofern dieser entsprechend menschliche Züge hat. Es gibt bereits Entwicklungen für Sprachassistenten, die durch soziale Interaktion einsamen Menschen ein besseres Lebensgefühl geben sollen. Was sich in einer so vollen Welt wie der aktuellen regelrecht etwas pervertiert anhört, ist jedoch immer noch besser als die Alternative der Vereinsamung oder Erkrankung. Entsprechend sind digitale Sprachassistenten auch der Leim zwischen dem Menschen und der Gesellschaft. Es ist durchaus möglich, dass sich einige Menschen, wie oft in vielen Kinofilmen dargestellt, in einer virtuellen Gesellschaft wohler fühlen, als in einer realen. Schaut man sich einige Gesellschaften genauer an, ist dieser Wunsch nach virtueller Gesellschaft und dessen Erfüllung manchmal vielleicht sogar nicht abwegig. Ob dies der richtige Weg zu einer friedlichen Welt ist, weiß natürlich niemand.

Zum Glück wollen die meisten Menschen in der Realität leben und sehen den digitalen Sprachassistenten als praktische Zugabe in ihrem Leben, die sich vom Nutzer entsprechend anpassen lässt. Die Konzerne, die entsprechende Sprachassistenzsysteme wie Amazon Alexa oder Apple Siri anbieten, wollen ihren Einfluss zum Nutzer dabei natürlich so groß wie möglich halten. Aus diesem Grund ist eine starke Anpassbarkeit der Persönlichkeit des digitalen Sprachassistenten auch seitens der Konzerne nicht wirklich gewünscht. Eine Siri von Apple, soll stets als Siri von Apple erkennbar bleiben. Ebenso wie eine Alexa beim Nutzer stets den Eindruck beim Nutzer hinterlassen soll, dass Amazon an der Seite des Nutzers steht. Wer seinen persönlichen virtuellen Assistenten in seiner Persönlichkeit wirklich selbst gestalten will, wird auf entsprechende Dienste und Angebote warten müssen. Aktuell ist die Darstellung der „Marke“ für die Konzerne noch viel zu wichtig, um den Nutzern eine persönliche Gestaltung des Wesens des Sprachassistenten durch den Nutzer zuzulassen, auch wenn genau dies meistens der eigentlich Ursprungswunsch des Nutzers war, um sich einen smarten Lautsprecher mit Sprachassistenten überhaupt zu kaufen.

Die Entwicklung der digitalen Sprachassistenten läuft in großen Schritten ab, auch wenn dies für den Nutzer nicht unbedingt direkt erkennbar ist. Bis die Systeme die Leistungsfähigkeit aus Kinofilmen haben, werden noch Jahre vergehen. Letztendlich ist es auch eine Generationsfrage, denn die Nutzer von heute müssen den Umgang mit Sprachassistenten erlernen, wogegen für die Nutzer von morgen, Dinge die nicht sprechen können, „kaputt“ sein werden.

Die Entwicklung selbst hat dabei bestimmte Sattelpunkte noch nicht überschritten, obwohl die Systeme von Anfang an darauf ausgelegt sind. Gemeint ist an dieser Stelle vor allem die „Absicht“ (Intent), die der Mensch in seinem situativen Fühlen, Denken, Handeln und Sprechen transportiert. Noch beschäftigen sich die Entwickler mit dem lösen von Problem, anstatt mit dem Anbieten von Lösungen und damit der Erfüllung der menschlichen Absicht (Was der Nutzer wirklich will!). Doch dies ist eine völlig normale Entwicklung wie bei jedem anderen bisherigen Medium auch. Der wissenschaftliche Anspruch an die digitale Sprachassistenz ist viel zu komplex und zu hoch, als dass sie sich als Hype entwickeln könnte. Der Abverkauf von Gadgets, die sich per Sprache steuern lassen dagegen, ist der Hype den wir aktuell am Markt haben und den die Konzerne mit großer Investition und Lust auch gerne bedienen. Egal ob der Nutzer da wirklich etwas mit anfangen kann oder nicht.

Bleiben wir gespannt….

Bis dahin kannst du mit deiner Teilnahme an der folgenden Umfrage, die Zukunft der Entwicklung von digitalen Sprachassistenten beeinflussen. Mach mit!

Unsere Experten auf homeandsmart.de

In unserer Berichterstattung greifen wir auf das tiefe Branchenwissen von renommierten Experten wie Robert Mendez zu den Themen Smart Home, Sprachassistenten und Elektromobilität zurück. Innerhalb von Gastbeiträgen veröffentlichen wir ihre exklusiven Einschätzungen und Hintergrundinformationen.

Weitere Experten-Beiträge finden Sie in unserem Experten-Verzeichnis.

Jetzt Experte werden!

Sind auch Sie ein Experte auf dem Gebiet Smart Home, IoT, Elektromobilität oder Connected Living? Wir geben auserwählten Experten die Möglichkeit, ihr Fachwissen auf homeandsmart mit unseren Lesern zu teilen.

Wir freuen uns über eine E-Mail – kontaktieren Sie uns gerne via kooperationen@homeandsmart.de!

Die mit * gekennzeichneten Links sind sogenannte Affiliate Links. Kommt über einen solchen Link ein Einkauf zustande, werden wir mit einer Provision beteiligt. Für Sie entstehen dabei keine Mehrkosten.
Wir haben Kooperationen mit verschiedenen Partnern. Unter anderem verdienen wir als Amazon-Partner an qualifizierten Verkäufen.

robert-mendez-sprachassistent-experte

Robert C. Mendez ist der Kopf hinter "Internet of Voice" aus Köln und Experte auf dem Gebiet der digitalen Sprachassistenten und Intent Marketing. Er ist seit über 30 Jahren digital unterwegs, nennt sich selbst „Smart Voice Evangelist“; Robert C. Mendez findet man an vielen Orten als Speaker, Informatiker, Designer und Berater wieder. Der Autor hält in deutsch- und spanischsprachigen Ländern Vorträge und gibt Workshops sowie Webinare.

Neues zu Smart Home Experte
verwandte Themen
News