Mehr Interaktion über Sprache und Screens – Die Zukunft von Voice Search, Voice Games und Co.

Mehr Interaktion über Sprache und Screens – Die Zukunft von Voice Search, Voice Games und Co.

Die Zahl der Smart Speaker steigt rasant, der Google Assistant weiß inzwischen auf viele Fragen sehr gute Antworten und Alexa versorgt immer mehr Menschen mit alltagsnahen und situativen Informationen. Die Voice Search gewinnt mit jeder technologischen Optimierung an Bedeutung – sodass Unternehmen und Websites auch sprachbasiert gefunden werden wollen. Visuelle und sprachlich vermittelte Inhalte werden künftig ein für User elementares Zusammenspiel darstellen, auf das es sich einzustellen gilt, etwa mit Voice Apps. Wir haben mit Tom Sebastian Mayr von Voicehub gesprochen, um zu erfahren, warum die meisten Suchanfragen schon heute per Voice beantwortet werden können, warum Voice Apps einen entscheidenden Vorteil haben und wie sich die generierten Daten für weiteres Marketing einsetzen lassen.
Voice-Lösungen können den Alltag der User erleichtern – und Anbietern Vorteile verschaffen
Obwohl wir immer mehr mit Künstlicher Intelligenz, Machine Learning-Prozessen und Sprachassistenzen im digitalen Raum in Berührung kommen, sind Unternehmen und Websites oft noch gar nicht auf die Anforderungen und Potentiale von Voice-Lösungen vorbereitet. Noch sagen viele User, dass sie deshalb keine Voice Search nutzen, weil sie es nicht gewohnt sind.
Gründe, warum User Voice Search nicht nutzen, © Uberall Doch das wird sich ändern. Es gibt zahlreiche Optionen, um sich im Age of Assistance auf Voice Search vorzubereiten. Dazu zählen Markups, eine simple Sprache, eine gehobene Sicherheit der Seite, FAQs, schnell ladende Websites usw. Doch auch Voice Apps und Alexa Skills sind Möglichkeiten, um sich in einem immer mehr durch Sprache gesteuerten Digitalraum Vorteile zu verschaffen.
So hat das Unternehmen Voicehub – Spezialist für Voice App Management – zusammen mit JustWatch einen Alexa Skill entwickelt, der als Streaming-Suchmaschine fungiert. Mit diesem können Nutzer erfragen, bei welchem Streamingdienst bestimmte Inhalte verfügbar sind.
Beispielfragen beim Alexa Skill JustWatch, Screenshot Amazon.de Christoph Hoyer, CMO bei JustWatch, erklärte uns:
Wir sehen in Sprachassistenten wie Amazon Alexa für JustWatch ein spannendes, wie relevantes Zukunftsfeld. Mit dem neuen Alexa Skill werden wir erstmals wertvolle Erfahrungen mit dieser Technologie sammeln können. Diese sollen uns bei der Weiterentwicklung, Konzeption und Integration der Sprachsteuerungskomponente in künftige JustWatch Produkte helfen.
Während uns die Optionen, die solch ein Skill liefert, im Alltag schon einige Vorteile liefern können, finden sich im Kontext der Nutzung von sprachbasierten Lösungen noch viel mehr Anwendungsbereiche – auch für innovatives Marketing. Darum haben wir mit Tom Sebastian Mayr, dem Gründer und Geschäftsführer von Voicehub, gesprochen und im Interview einige aufschlussreiche Insights zum Status quo und zur Zukunft von Voice erhalten.
Das Interview
OnlineMarketing.de: Voice hat mit dem Google Assistant, Alexa, auch Siri und Cortana längst den digitalen Alltag erobert. Glaubst du, dass in fünf Jahren der Großteil der Suche und Informationsbeschaffung auf dieser Ebene abläuft?
Tom Sebastian Mayr von Voicehub, © Tom Sebastian Mayr Tom Sebastian Mayr: Davon bin ich fest überzeugt und ich kann dir auch sagen warum: Wenn man sich den Großteil der Suchanfragen im Web anschaut, dann kann der überwiegende Teil an Anfragen mit nur wenigen Sätzen beantwortet werden. Dieser Teil lässt sich sehr einfach durch Voice abbilden und ermöglicht dem Nutzer, dass er schneller die Antwort auf seine Suchanfrage bekommt. Alle Anfragen, bei denen die Antwort eine ausführliche Recherche mit dem Vergleich von vielen unterschiedlichen Quellen bedarf, wird auch zunächst weiterhin die Unterstützung eines Screens benötigen. Die Kombination von visuellen Inhalten und sprachbassierten Suchanfragen ist da eine spannende Möglichkeit.
OnlineMarketing.de: Websites sollten auf Strukturierte Daten setzen, um ihren Content für Googles Assistant zu optimieren. Alexa Skills oder Voice Apps sind weitere Optionen, um die Nutzer entsprechend dieser Entwicklung abzuholen. Sollten Unternehmen also eher gestern als morgen auf eine eigene Strategie setzen, um ihre Inhalte und Produkte sprachbasiert darzustellen?
Tom Sebastian Mayr: Die Frage kann ich mit einem klaren „Ja“ beantworten. Es gilt aber auch das ganze ins Verhältnis zu setzen. Ich denke es ist wie immer eine Verlagerung von den Kanälen. Dabei wird Voice natürlich nicht der einzige Kanal für die Beschaffung von Informationen über Produkte oder Dienstleistungen sein, jedoch ein sehr wichtiger. Somit sollten Unternehmen definitiv so früh wie möglich damit Anfangen ihren Kunden sprachbasierte Inhalte zur Verfügung zu stellen, denn gerade jetzt am Anfang dieser Entwicklung ist die Konkurrenz in vielen Bereich noch nicht sehr hoch. Das bietet einige Chancen für Unternehmen, sich First Mover Vorteile zu sichern.
OnlineMarketing.de:  Was können Voice Apps hierbei konkret leisten?
Tom Sebastian Mayr: Voice Apps haben einen entscheidenden Vorteil gegenüber einer klassischen Voice Search-Anfrage: Ich kann als Unternehmen bestimmen, wie ich mit einem Nutzer interagiere. Innerhalb einer Voice App kann ich Rückfragen an den Nutzer stellen und so eine tiefergehende Interaktion erreichen. Dadurch lerne ich extrem viel über den Nutzer. Auch bei Fragestellungen, bei denen vom Nutzer selbst keine Voice App initial angesprochen hat, wird der Sprachassistent vermehrt auf Voice Apps zurückgreifen. Der Grund dafür ist, dass innerhalb von Voice Apps der Content für die Sprachausgabe optimiert ist. Welche Voice App da von Amazon Alexa oder dem Google Assistant angesprochen wird, ist davon abhängig, welche App die meisten Nutzer und die besten Interaktionsraten hat.
OnlineMarketing.de: In welchem Umfang können die Daten, die bei der Nutzung von Voice Apps erhoben werden, künftiges Targeting und auch die eigene Content-Kreation beeinflussen?
Tom Sebastian Mayr: Die Daten von Voice Apps können eine sehr große Rolle für das Targeting von Inhalten spielen. Lass mich dazu auf folgendes Beispiel eingehen: Stell dir einen Nutzer vor, der gerade ein Smart-Display vor sich hat und nach einem T-Shirt sucht. Nun betrachtet der Nutzer gerade ein T-Shirt auf dem Screen, er will das Shirt aber in einer anderen Farbe haben. Also sagt er z.B. „Alexa, gibt es das T-Shirt auch in Grün?“ Wenn er ausschließlich ein grünes T-Shirt haben will und Alexa antwortet „Tut mir leid, das haben wir leider nicht.“, dann wird der Nutzer den Kauf wahrscheinlich abbrechen. Wir haben jedoch einen wichtigen neuen Insight gewonnen: Der Nutzer hat aktiv nach diesem T-Shirt in grün gefragt. Somit können wir das im Targeting verwenden und ihm das grüne T-Shirt anbieten, sobald es auf Lager ist. Wir lernen also sehr viel über den Nutzer, indem wir gezielte Rückfragen stellen und dadurch Informationen sammeln, die wir nicht bekommen hätten, wenn der Nutzer innerhalb von einer Webseite oder Smartphone App mit dem Unternehmen interagiert hätte.
OnlineMarketing.de: Ihr habt gerade einen Case mit Amazon und JustWatch in Arbeit. Kannst du uns aus deiner Sicht darlegen, warum es so wichtig ist, dass die User Voice-gestützt Abhilfe bei der Film- und Serienauswahl erhalten?
Tom Sebastian Mayr: Generell sind Streamingplattformen seit Jahren extrem am Wachsen. Beinah wöchentlich gibt es neue Serien und Filme. Mir fällt es da manchmal extrem schwer den Überblick über das Angebot zu behalten. Folgendes Beispiel dazu: Du sitzt abends auf der Couch mit ein paar Freunden und ihr überlegt, welchen Film ihr schauen wollt. Sobald die ersten Ideen vorhanden sind, stellt sich eine entscheidende Frage: Welche Filme kann ich auf welcher Plattform überhaupt schauen? Mit Hilfe des Alexa Skills von JustWatch kannst du das ganz einfach herausfinden. Z.B. kannst du fragen: „Alexa, frag JustWatch wo wir Stirb Langsam Teil 1 schauen können!“ Alexa wird dir dann sagen, ob du den Film bei irgendeinem deiner zuvor definierten Streaminganbieter streamen kannst. Dabei ist der ganze Vorgang wesentlich schneller, als wenn du dafür einen Laptop oder dein Smartphone bemühst. In der Zukunft ist z.B. auch denkbar, dass der Skill dir Filme und Serien basierend auf deinen Suchanfragen und verfügbaren Streamingplattformen empfiehlt.
OnlineMarketing.de: Steht Voice als Sprachassistenz also an der Schwelle von einer beeindruckenden Option zur Antwort auf klar formulierte Fragen hin zur KI-basierten Beratungsfunktion?
Tom Sebastian Mayr: Innerhalb von bestimmten Restriktionen ist es auch jetzt schon möglich Empfehlungen durch Voice Apps anzubieten. In der simpelsten Form kann ich dem Nutzer beim erstmaligen Starten meiner Voice App ein paar kurze Set-Up-Fragen stellen. Mit Hilfe der Antworten kann ich eingrenzen, an welchen Produkten er eventuell interessiert ist und diese Informationen für das Ausspielen von Empfehlungen nutzen. Momentan ist es jedoch noch so, dass ich als Entwickler zuvor mögliche Antworten definieren muss (vor allem bei Alexa). Das bedeutet, dass der Nutzer nicht wirklich frei auf meine Set-Up-Fragen antworten, sondern lediglich zwischen bestimmten Antwortmöglichkeiten wählen kann. Das macht es schwierig, dem Nutzer die perfekte Empfehlung zu geben. Google und Amazon arbeiten aber schon verstärkt daran Entwicklern hier mehr Möglichkeiten zu bieten.
OnlineMarketing.de: User setzen gerade in Search auf Reviews und Co., um sich zu entscheiden. Können Empfehlungen über Voice Apps gerade im digitalen Produktmarketing in der Voice Search das Zünglein an der Waage spielen?
Tom Sebastian Mayr: Voice Apps können definitiv eine große Rolle in diesem Bereich spielen. Eine wichtige Bedingung muss jedoch zuvor erfüllt sein: Die Empfehlungen müssen glaubhaft und authentisch sein. Meistens wird per Voice nur eine Antwort ausgegeben, im besten Fall gibt es noch eine oder zwei Alternativen. So müssen die Nutzer darauf vertrauen können, dass die wenigen Antworten glaubhaft und im ihrem Interesse sind.Deswegen glaube ich auch, dass z.B. Voice Ads noch länger kein Thema für Alexa oder den Google Assistent sein werden. Denn Voice Ads haben wahrscheinlich nicht immer das beste Ergebnis für den Nutzer im Sinn, sondern sind meistens positiv für denjenigen, der am meisten für die beste Positionierung bezahlt.
OnlineMarketing.de: Für welche konkreten Bereiche und Branchen sind deiner Meinung nach Voice Apps schon jetzt eine messbar marketingrelevante Lösung?
Tom Sebastian Mayr: Hier gibt es wirklich schon einige Bereiche, die da sehr spannend sind. Um erstmal ein Gegenbeispiel zu liefern: Wenn es einen Wetterdienst gibt, der noch keinen eigenen Skill bzw. Action rausgebracht hat, dann hat er diese Entwicklung, obwohl sie noch so jung ist, schon komplett verschlafen. Ansonsten sehe ich drei Bereiche / Branchen bei Voice aktuell ganz vorne mit dabei: Versicherungen, Einzelhändler und Spiele-Entwickler.Im Bereich Versicherung gibt es schon einige sehr relevante Beispiele, wie dort mit Kunden interagiert wird. So haben die Techniker Krankenkasse oder die Barmer Versicherung zunächst reine Marketing-Skills veröffentlicht. Die kommen mit ihren Entspannungsprogrammen extrem gut an. Andere, wie die Deutsche Familienversicherung oder die Allianz, haben bereits produktbezogene Anwendungen veröffentlicht. Im Einzelhandel hat etwa. REWE schon ordentlichen Erfolg mit einem Skill, welcher dir dabei hilft deine Einkaufsliste zu verwalten oder Rezepte empfiehlt. Auch Voice Games haben sich als ein großer Bereich herausgestellt, der von Spieleentwicklern bereits aktiv vorangetrieben wird und der mit Unternehmen wie Volley aus den USA auch schon erste Erfolgsgeschichten vorzuzeigen hat.
OnlineMarketing.de: Glaubst du, dass wir schon bald Produkte und Content bei großen Plattformen vorrangig über Voice suchen werden oder wird diese Option die klassische Klick-, Swipe- und Textbedienung lediglich ergänzen?
Tom Sebastian Mayr: Das ist ein grundlegender Glaube, den wir bei Voicehub haben und war auch einer der Gründe, warum wir Voicehub gegründet haben. Voice wird hier sicherlich eine große Rolle spielen und auch in einigen Bereichen die dominante Form der Kommunikation sein, aber ich denke nicht, dass Voice alles komplett übernehmen wird. Ich glaube, dass es eine Verschiebung zwischen den Kanälen geben wird. Das konnten wir auch schon bei den letzten Entwicklungszyklen von anderen Technologien beobachten. Tastaturen oder Touchscreens werden weiterhin eine Rolle spielen.Auch werden Screens nicht vollständig wegfallen. Ganz im Gegenteil: Voice wird zunehmend in Geräte integriert, die auch einen Screen haben (z.B. Fernseher). Wir als Menschen werden auch weiterhin viele Informationen über unsere Augen wahrnehmen. Dass insgesamt ein immer größer werdender Teil der Interkationen mit Sprache und Screen oder nur per Sprache stattfinden wird, davon bin ich überzeugt.
Wir bedanken uns herzlich für das Interview und die interessanten Einsichten zu diesem spannenden und zukunftsorientierten Thema.