Die 7 wichtigsten Infos über Voice User Interfaces

Die 7 wichtigsten Infos über Voice User Interfaces

Wir alle verlassen uns mittlerweile auf die Dienste von Amazon Alexa, Apple Siri und Hey Google Assistant. Für viele sind die virtuellen Assistenten (VA) unverzichtbar geworden.

Voice User Interfaces (VUIs) von Tech-Giganten wie Google, Apple und Amazon dominieren den Markt. Siri und Google Assistant haben einen Anteil von 36 %, auf dem Voice Recognition Markt, der im Jahr 2020 auf 13,65 Milliarden US-Dollar geschätzt wird.

Eine Voice Interface Definition ist eine elektronische Komponente. Das versteckte Interface ermöglicht es Usern, per Sprachsteuerung Befehle ausführen zu lassen.

Google-Statistiken zufolge stellen 41 % der User die Kommunikation mit VUI einem menschlichen Gesprächspartner gleich. Startups, die in einem komplexen Technologiemarkt überleben wollen, sollten aus diversen Gründen in VUI- und UX-Systeme investieren.


1. Voice User Interface und seine VUI-Komponenten

VUI ist das Ergebnis der Kombination komplizierter Facetten von Künstlicher Intelligenz (KI), Sprachtechnologie, automatischer Spracherkennung und Erkennung von Namensbestandteilen. Damit das Voice User Interface Design effektiv funktioniert, programmieren UX-Designer sie in Geräte oder installieren sie in Anwendungen und mobilen Apps.

Das funktioniert durch die Kombination von automatischer Spracherkennung (ASR) mit KI und der Verarbeitung natürlicher Sprache.

VUI ist bereits fester Bestandteil in der Web-Recherche, Musik, dem Internet of Things (IoT), den Nachrichten, sowie den Aspekten der Service- und Gesundheitsbranche und automatisierten Tasks.

Siri, Google Now und Microsoft Cortana sind sprachgesteuerte Benutzeroberflächen, die Bilder und Sprache verwenden. Amazon Echo und Google Home sind Beispiele für VUIs, die auf der zweiten Generation auditiver Technologie basieren.

Eine der wertvollsten Komponenten von VUI ist die Vielseitigkeit. Im Backend ermöglichen die Sprachelemente der VUI in Verbindung mit dem Zugriff auf KI-Technologien und Cloud-Technologien die Interaktion mit den Sprachbefehlen des Users.

Damit VUI effizient funktioniert, sind einige Komponenten erforderlich:

  • Grafische Benutzeroberfläche (GUI)
  • Simulierte Soundeffekte, um dem User ein optimales Erlebnis zu bieten
  • Visuelle oder akustische Signale, wenn ein Gerät verfügbar ist (z.B. blinkendes Licht)
  • Verarbeitung von Sprachmustern
  • Reaktion auf User

2. Die Zukunft der sprachgesteuerten Geräte

Giganten wie Google haben Designern den Weg geebnet, wie sie sprachgesteuerte User Interfaces gestalten können - weg von Roboterstimmen hin zu Anwendungen, die so realistisch wie möglich klingen.

Google Pathway bietet Tools, mit denen Designer von VUI virtuelle Assistenten entwickeln können, die authentisch klingen.

Ein goldenes Zahlenschloss liegt auf einer weißen Tastatur neben zwei goldenen Chipkarten.
Photo by Towfiqu barbhuiya / Unsplash

Designer haben viele Möglichkeiten, die Sicherheit der User zu fördern, da die Interaktionen zwischen Menschen und VUI stetig zunehmen. Der Schutz der Privatsphäre ist ein wichtiges Thema, und die unbeabsichtigte Aktivierung und Aufzeichnung von personenbezogenen Daten lässt viele zögern. Viele User haben Angst davor, wo ihre Daten hingehen und wie diese verarbeitet werden.

Dennoch hat die VUI eine vielversprechende Zukunft. Viele arbeiten bereits mit KI und haben nichts dagegen, sie zu vermenschlichen. Die Designer müssen Methoden finden, um die Nutzung zu personalisieren, sowie die Verwendung von VUI-Technologie angenehm und produktiv zu machen.

VUI Partner und IoT

Die meisten von uns besitzen Smart Devices, wobei Smartphones den Weg geebnet haben und bis heute dominieren. Jedoch ist die Möglichkeit, KI und IoT zu verbinden, eine sehr vielversprechende.

Statistiken zeigen, dass 53 % der Erwachsenen VUI auf ihren Smartphones verwenden. Nutzung virtueller Assistenten nach Gerät:

  • 24 % auf SmartTV und Fernbedienungen
  • 23 % im Auto
  • 9% auf Haushaltsgeräten
  • 62 % der Smartphone-Nutzer verwenden VUI beim Autofahren

Diese Zahlen deuten darauf hin, dass wir künftig immer mehr auf VUI umsteigen, um uns durch das Leben zu navigieren. Es gibt jedoch noch enormes Potenzial zur Verbesserung des Software-VUI-Designs und zur Steigerung der VA-Nutzung.

Mann mit schwarzem Shirt, der ein Handy in den Händen hält und darauf schaut, eine Pflanze neben ihm.
Photo by Jonas Leupe / Unsplash

VUI-Geräte treiben unseren Durst nach Funktionalität auf unseren SmartWatches, Laptops, Sprachassistenten, Smart Home-Lautsprechern und dem IoT wie z.B. Alarmanlagen an. Es gibt ungenutzte Möglichkeiten, und wir müssen die Generationen zum Umstieg motivieren.


3. Die Zukunft der Voice User Experience

Spracherkennung, Voice User Interface und Voice User Experience sind nur ein paar Schlagworte für die Gestaltung von VUI.

Man muss kein Visionär sein, um zu wissen, dass sprachgesteuerteBenutzeroberflächen Teil des Tech-Marktes sind, der nach vorsichtigen Schätzungen bis 2025 einen Marktanteil von 24,9 Milliarden US-Dollar erreichen wird.

Eines der Schlüsselelemente, die dieses Wachstum vorantreiben, sind einige wichtige Unternehmen. Diese suchen nach einfallsreichen Wegen, um aktuelle KI-Voice Interfaces in intuitive, technisch generierte Wesen zu verwandeln, die menschliche Sprachbefehle verstehen und verarbeiten.

Sprachbefehle mögen für viele wie Spielereien erscheinen. VUIs tragen jedoch dazu bei, dass wir in manchen Situationen sicherer durch den Alltag gehen. Anstatt beispielsweise beim Autofahren Multitasking zu betreiben, können wir dank VUI unsere Augen sicher und ohne weitere Ablenkung auf die Straße richten.

Designer müssen sich auf diese Anforderungen einstellen, indem sie die Funktionalität eines Produkts bereitstellen und es benutzerfreundlich gestalten. Eine sprachgesteuerte KI versteht bestenfalls Menschen ohne große Probleme.

Dem User ist es egal, dass hinter dem VUI ein Designteam steht, das wichtige Elemente vergessen hat oder die Feinheiten der menschlichen Sprache und Kommunikation nicht versteht.

Daher besteht eine der größten Herausforderungen darin, das Design der Software-VUI in die Sprache zu integrieren. Die deutsche Sprache zum Beispiel ist in ihrer Hochform sehr präzise und geordnet. Es gibt aber auch Hunderte von Dialekten und englischen Ausdrücken, die die Grundlagen der Sprache verwirren.

In jeder Sprache gibt es Slangs, Redewendungen, umgangssprachliche Zusammenhänge und Anspielungen. In genau diesen Fällen ist es für die KI schwierig, das Gesagte richtig zu interpretieren und eine korrekte interaktive Antwort zu erstellen. Manchmal sind es nur Nuancen, die den Unterschied ausmachen.


4. Erstellung VUI-Dialog

Kommunikation ist ein wichtiges Werkzeug im täglichen Leben und ein riesiger Bestandteil in der VUI-Technologie. Das Verstehen und Entwerfen des User Flows und das Schreiben von Skripten sind wichtige Grundlagen für erfolgreiche Voice Interfaces.

VUI basiert auf Musterdialogen, nicht auf Wireframes. Um einen brauchbaren Dialog zu entwickeln, erstellen Designer User Stories. Das sind einfache Szenarien, die:

  • nach Fertigstellung für den User nützlich sind
  • auf Szenarien basieren, die auf die Situation anwendbar sind
  • verfeinerte Situationen simulieren, um den Zweck einer Schnittstelle zu beschreiben
  • es dem User ermöglichen, im Dialog zu interagieren

Sobald die Designer über die Grundlage verfügen, können sie diese bis ins Detail ausarbeiten:

  • Beispiel für relevante Dialoge für User und Situation
  • Dialog in der frühen Entwicklungsphase (nützlich für Prototypen und Kundenfeedback)
  • VUI in diesem Stadium ähnelt dem Wireframing von Webanwendungen

Beispielskripte erstellen

Das Schreiben von Dialogen ist einfach und natürlich. Die Designer stellen sich vor, wie ein typischer Anruf ablaufen könnte, und füllen die Lücken aus.

Viele VUI erfordern eine Sprachansage wie "Hallo", um zu funktionieren. Ein Kunde, der bei einem Restaurant anruft, könnte sich zum Beispiel so anhören:

Burger Express: Burger Express. Darf ich Ihre Bestellung entgegennehmen?
Kunde A: Ja
Burger Express: Haben Sie eine Bestellnummer?
Kunde A: Ja, meine Bestellnummer ist 1234.
Burger Express: Okay, 1234, Howard Smith. Ist das richtig?
Kunde A: Ja.
Burger Express: Fahren Sie mit Ihrer Bestellung fort.
Kunde A: Ich hätte gerne eine Combo #2, drei Combo #7 und einen Milchshake.
Burger Express: Möchten Sie noch Desserts oder Getränke zusätzlich?

... und so weiter.

Es ist Aufgabe des Designteams, auf diesem einfachen Dialog zwischen einem Kunden und einem System aufzubauen und mehrere Szenarien, einschließlich Problemfälle, vorherzusagen.

Die Designer müssen einen natürlichen Dialog verwenden, der Kontraktionen und Discourse Marker enthält. Die Idee hinter diesen Beispielübungen und -antworten ist, sie authentisch klingen zu lassen, ohne in Fachsprache oder Branchenjargon abzutauchen.

Hilfreiche Informationen zum Erstellen prägnanter Dialoge sind auf Google Conversation Design zu finden.

Schwarzes Tablet, schwarzer Stift und weiße Tastatur auf gelbem Hintergrund.
Photo by Volodymyr Hryshchenko / Unsplash

Zusammenarbeit

Kommunikation ist eine komplexe Fähigkeit. Wenn Designer ihre VUI-Szenarien entwerfen, müssen sie daran denken, ihrer Strategie eine kooperative Denkweise zu verleihen.

  • Informativ sein, ohne mit unnötigen Details zu belasten
  • Wahrheitsgemäße Informationen bereitstellen
  • Bei der aktuellen Diskussion bleiben
  • Klar antworten, ohne vage oder irreführend zu sein

Diese wesentlichen Grundsätze sind Teil der Grice’schen Conversation Guidelines.

Konkurrent verstehen

Das Internet kann sehr hilfreich sein, um von der Konkurrenz zu lernen. Die Nutzung verfügbarer Ressourcen ist eine wertvolle Taktik bei der Entwicklung jeder neuen Plattform. Dabei sollte man Technologieführer wie Apple Homepod, Amazon Alexa, Echo Dot, Echo Alexa und Amazon Echo analysieren.

Stelle dir dabei folgende Fragen:

  • Wer ist meine Konkurrenz?
  • Welche Dienstleistungen und Produkte bieten sie an?
  • Wer sind ihre Kunden?
  • Was ist ihre Marke?
  • Wie vermarkten sie ihren Service?
  • Was ist ihr Wachstum?
  • Was machen sie gut und was muss verbessert werden?
Die Konkurrenz ist meist der beste Wegweiser. Achte jedoch auf professionelle Grenzen und respektiere das Urheberrecht und geistige Eigentum.

Basics des VUI Design

Die Grundlagen der VUI sind einfache Konzepte, die das Problem, die Bedürfnisse und die Anforderungen des Users definieren.

In diesem Stadium hat ein Designer die Grundlagen bereits mit Hilfe der Sprache verfeinert und von der Konkurrenz gelernt. Testmuster zeigen Schwachstellen auf und geben wertvolles Feedback, welches man dann in brauchbare Skripte umsetzen kann.

Erfasse Feedback durch:

  • Flow Maps verwenden
  • Hervorhebung von User-Anforderungen
  • Antizipieren von User Stories
  • Abfolge der Dialoge für jede User Story genau überprüfen
  • Auswerten von Antworten zwischen Benutzer und Gerät

Brauchbare Prototypes erstellen

Prototypen sind eine wichtige Komponente im VUI-Konversationsdesign. Die Designer wissen jetzt genau, was ihre VUI braucht, um ein erfolgreiches Text-to-Speech-Modell zu entwickeln.

VUI-Prototypen umfassen diese Aktionspunkte:

  • Grundlegende Interaktion und Dialog
  • Eine starke Fehlerstrategie, um die Konversation auf sicheres Terrain zu führen
  • Ein solides Maß an Sicherheit bieten
  • Einbindung wichtiger Auslösewörter wie "Hey Google".
  • Optionen für die Nutzer zur Navigation bieten

Biete den Usern Aufforderungen für einen geeigneten Beispieldialog. Designer können auf praktische Prototyping-Apps zugreifen, um diesen Prozess zu beschleunigen.

Hilfreiche VUI-Dialog-Apps:

Die Anatomie der Sprachsteuerung

Die Sprachsteuerung ist ein großartiges Werkzeug. Designer müssen auf den Grundlagen der Kommunikation aufbauen und die Bedürfnisse des Users korrekt erfassen und umsetzen.

Ein User gibt seinen Befehl aufgrund von drei motivierenden Faktoren ab:

  • Intention
  • Äußerung
  • Slot oder optionale Variablen

Elemente der Sprachbefehle und -interaktion

Ein Sprachbefehl ist eine einfache Anweisung. Diese Absicht oder dieses Objekt ist die Ursache für die Sprachanwendung. Sie werden durch Low-Utility- oder High-Utility-Anfragen definiert.

Low Utility ist ein Befehl, der eine Frage nach weiteren Informationen stellt. High Utility ist ein Befehl mit einer direkten und korrekten Antwort, z.B.: Wie spät ist es? Oder wie wird das Wetter heute Abend?

Das Stellen einer Anfrage über die VUI hängt von der Formulierung oder Äußerung des Users ab. Wir sprechen mit unseren Geräten mit verschiedenen Sprachbefehlen und Wortfolgen.

Beispiel: "Siri, spiele Beethovens Mondscheinsonate!" oder "Siri, suche nach meiner Lieblingsversion der Mondscheinsonate von Beethoven." Intelligente VUI übersetzt unsere Sprachbefehle unabhängig von der Sprache und dem Stil und antwortet mit den richtigen Ergebnissen.

Außerdem benötigt die VUI optionale Variablen, um unsere Anforderung zu erfüllen. Optionale Variablen sind die Details, die die VUI benötigt, um die Aufgabe zu erledigen. Beispiel: "Alexa, bestelle mir eine Kaffeemaschine!" Die Anfrage ist so vage, dass Alexa diese nicht erfüllen kann. Stattdessen sollte man die Marke, ein möglichst genaues Modell und einen Preis nennen.

Das Schöne an der Sprachtechnologie ist, dass die Stimme des Benutzers die gesamte Arbeit erledigen kann, ohne etwas zu berühren. Die Designer von VUI müssen den nächsten Schritt verstehen, nämlich dass VUI eine erfolgreiche Transaktion abschließt.

VUX ist das Markenzeichen von VUIs wie Alexa, Google Assistant und Siri. Ein positives und sympathisches Benutzererlebnis verleitet den User dazu, das Produkt zu benutzen. Die Menschen wollen ein persönliches Erlebnis mit einer authentischen Stimme und natürlich eine hohe Qualität des maschinellen Lernens.


5. Kreative Tools für Design VUI

Wir haben uns bereits mit den grundlegenden Kommunikationsfähigkeiten hinter VUI befasst. Im Folgenden werden die für die Erstellung von VUI erforderlichen Tools näher erläutert.

Text-Szenarios

Dieser Schritt ist in verschiedenen Phasen des Projektverlaufs unentbehrlich. Text in der Entwurfsphase ermöglicht:

  • Product Ideation (gezieltes Sammeln, Organisieren und Implementieren)
  • Iteration ist wie eine Produktüberarbeitung zur Verbesserung der Benutzererfahrung (um echtes Benutzerfeedback zu erhalten)
  • Usability Testing identifiziert strategische Bereiche, die analysiert werden müssen

Textszenarien sind fiktive Situationen, wie ein User mit einer VUI und ihrer Anwendung interagieren könnte.

Bunte Plättchen mit Buchstaben darauf liegen gemischt zusammen.
Photo by Surendran MP / Unsplash

UX- und UI-Designer sammeln Ideen und setzen die Aktionen der User anhand dieser Schlüsselparameter um:

  • Fragen, die den Benutzer, seine Bedürfnisse und Ziele identifizieren
  • Ergebnisse, die von echten Nutzern stammen
  • Verkapselt Details für spezifische und genaue Ergebnisse

Textszenarien sind wichtig, um herauszufinden, wie eine Person die Sprachsteuerungstechnologie nutzt. Die Designer prognostizieren den Gesprächsverlauf, das Verhalten des Benutzers und legen Projektlösungen fest.

Storyboards

Storyboard-Illustrationen haben einen großen Einfluss auf das Design, da sie kostengünstig und effektiv sind und die Methode des Users näher beleuchten.

Storyboards helfen bei:

  • Priorisierung der Abfolge von Ereignissen
  • Einladen von Teams zur Teilnahme und Zusammenarbeit
  • Aufzeigen von Lücken in der Abfolge
  • Den Fokus auf die Erfahrung des Users zu legen

Anwendungen für Storyboards:

  • Erklären eines bestimmten Vorgangs für Nicht-Design-Teammitglieder
  • Veranschaulichung der Benutzerbedürfnisse und wie die VUI diese Bedürfnisse erfüllt
  • Vereinheitlicht gemeinsame Ziele innerhalb von Abteilungen
  • Rekapituliert die Benutzerinteraktion

Voice UX ist etwas anders als Touch-Interaktionen und daher schwieriger zu konzipieren. Die Verwendung von Storyboards veranschaulicht die Gewohnheiten des Users und zeigt, wie ein VUI die Reise reibungsloser gestaltet.

Video

Video, begleitet von Audio, macht aus einem geskripteten Dialog eine Live-Performance. Designer können das Benutzerverhalten beobachten und die VUI-Reaktionen leichter abstimmen.

Flow Maps

Herkömmliche Telefondialoge und mobile Sprachprodukte weichen von geskripteten Dialogen ab, um das Erlebnis unterhaltsamer zu gestalten.

Flow Maps oder User Flow-Diagramme verwenden Sequenzdiagramme. Diese komplexen Diagramme verhindern potenzielle Stolpersteine in der Entwicklung und im Benutzererlebnis. Flow Maps unterscheiden sich von denen für VUX, da der User mit dem VA nur über die Stimme kommuniziert.

Wichtige Anhaltspunkte für Flow Maps:

  • Benutzeranfragen durch Äußerungen darstellen
  • Reaktion des VA einschließlich des Fehlerpotenzials aufzeigen
  • Zeigen, wie der VA einschlägige Informationen und Variablen sammelt
  • Benutzerergebnis erstellen
  • Zeigen, wie der VA wesentliche Details aus den bereitgestellten Informationen extrahiert
  • Was geschieht, wenn der Benutzer ohne Zutun der VA abbricht?
  • Wie wird eine Aktion ohne eine Antwort abgeschlossen?

Phrase Maps

Es gibt hundert Möglichkeiten, eine Anfrage zu formulieren. Phrase Maps fügen sich in die Flow Map ein und identifizieren die Formulierungen oder Äußerungen, die die VUI aktivieren werden.

Die Designer müssen diese Skripte in lesbare Phrasen einarbeiten, die von den Entwicklern in ein maschinenlesbares Format übertragen werden.


6. Herausforderungen bei der Gestaltung von Voice User Interface Experience

Die Entwicklung von VUI steckt noch in den Kinderschuhen. Während die Benutzer auf diese neue Plattform migrieren, besteht die Herausforderung darin, die Funktionalität der VUI zu entwickeln.

VUI und Sicherheit

Je schneller die Technologie voranschreitet, desto weniger sicher fühlen sich die Verbraucher. Abhörgeräte verbreiten Misstrauen, daher wird die Hardware zur Bekämpfung dieses Problems weiterentwickelt.

Netzwerkzugang

Einige ländliche Gebiete oder Entwicklungsländer können keine vollständigen Netzkapazitäten bieten. Damit ist die VUI für Millionen von Menschen nicht nutzbar.

Wirres Netz aus schwarzem Draht
Photo by Alina Grubnyak / Unsplash

Netzwerkgeschwindigkeit

Die User erwarten, dass die Internetgeschwindigkeit ihren Bedürfnissen entspricht. Leider ist dies nicht immer der Fall, wobei in den letzten Jahren immer mehr daran gearbeitet wird.

Sprache

Die Gestaltung der Spracherfahrung führt uns zurück zur Sprache. Cloud-Sprachdienste bieten ihre Dienste nur in einigen wenigen Sprachen an und müssen mit Dialekten und Akzenten zurechtkommen.

7. Validating the Importance of  VUI With Designers

Die Designer haben uns schon jetzt sehr weit gebracht. Die Welt der VUI ist riesig und hat das Tippen überholt. Statistiken zeigen, dass 71 % der User VUI bevorzugen, und die Nutzung von Smart Speakern nimmt zu. Intelligentes VUI-Design hängt davon ab, die menschliche Kommunikation mit KI-Systemen zu vereinen und so die Befehle zu verstehen.

Es ist von außerordentlicher Bedeutung, alle Details aus den besprochenen Quellen zu extrahieren und sie auf VUI anzuwenden. KI hat den Designern bereits die Werkzeuge an die Hand gegeben, jetzt ist es an der Zeit, sie richtig zu verwenden.

Der KI-Markt beläuft sich auf 136,6 Milliarden US-Dollar, und das Wachstum im VUI-Segment ist kaum aufzuhalten. Aus diesem Grund hat VUI-Design das Potenzial, die Art und Weise, wie wir in Zukunft kommunizieren, zu verändern. Großartiges VUI-Design wird sich auf jede Facette unseres Lebens auswirken und Probleme lösen.


Fazit

Das Thema VUI ist sehr umfangreich, und die Möglichkeiten, die sich daraus ergeben, sind noch viel größer. VUIs stecken noch in den Kinderschuhen und müssen erst noch lernen, Hindernisse zu überwinden. Start-ups, die hoffen, die Komplikationen zu überwinden, können ihre Bedürfnisse leicht an Produkt- und Strategiespezialisten weitergeben.

VUI-Designer haben einen großen Einfluss darauf, wie die User auf die Technologie reagieren und sie zu Hause und im Geschäftsleben nutzen und eine gewinnbringende UX-Erfahrung machen.