Abbildung Smartspeaker
© Andres Urena

„Alexa, erklär mir die Welt!“ – Wie Sprachassistenten die Informationssuche im Netz verändern

Franziska Gaiser und Sonja Utz, IWM

Das Internet ist für die meisten Menschen zur wichtigsten Quelle für Informationen geworden. Es bietet NutzerInnen einen schnellen Zugang zu fast allen Informationen, zur Beantwortung von Fragen oder zu Recherche. Das beliebteste Vorgehen ist dabei aktuell noch die Eingabe von Suchbegriffen bei Suchmaschinen wie Google oder Bing. Sprachbasierte Anwendungen, wie Alexa oder Google Assistant, ermöglichen jedoch mittlerweile auch die Suche per Stimme und sind inzwischen eine weit verbreitete Funktion auf verschiedensten Geräten wie Smartphones, Tablets oder Computern. Laut Angaben von Google, werden bereits 20% aller mobilen Suchanfragen auf Android per Stimme getätigt (Stafford & Thompson, 2017).

In den letzten Jahren wurde die Stimme jedoch auch zur primären Schnittstelle für eigenständige Geräte. Dort, wo bisher immer noch eine Schnittstelle, in Form einer Tastatur, Maus oder Bildschirm, verwendet werden musste, genügt nun Sprache. Die prominentesten Beispiele dafür sind sogenannte Smart Speaker, eine Kombination aus Lautsprechern, Mikrofonen und Schnittstellen, die sie digital vernetzen (Ferdinand & Jetzke, 2017). Die Geräte folgen der Idee eines virtuellen Butlers, der dem Benutzer oder der Benutzerin bei der Lösung verschiedener Aufgaben hilft. Sie sollen den häuslichen Alltag durch ihre Funktionen digitaler, komfortabler und bequemer gestalten. Die elektronischen Helfer erinnern beispielsweise an Termine, steuern das Smart Home oder spielen Musik oder die Nachrichten ab.

Repräsentative Umfragen in Deutschland im Jahr 2019 zeigten, dass bereits 29% der Befragten einen Smart Speaker besitzen und schon 52% der Haushalte mit vier Personen oder mehr mit einem Smart Speaker zusammen leben (Postbank 2019; Statista, 2019). Das Verbraucherinteresse ist groß und nahezu alle großen Technologiekonzerne ergänzen smarte Lautsprecher mittlerweile in ihren Produktkategorien.

Die Geräte bieten BenutzerInnen auch eine neue Möglichkeit nach Informationen zu suchen. „Alexa, wie wird morgen das Wetter?“, „Ok Google, wo liegt die Stadt Kuala Lumpur?“, „Siri, was sind Viren?“.

Aktuelle Untersuchungen zeigen, dass die Beantwortung von Fakten- und Wissensfragen zu den drei am häufigsten verwendeten Funktionen von Smart Speakern gehört (Gentemann, 2018). Die Geräte werden somit häufig zur Informationssuche verwendet und bieten eine Alternative zu herkömmlichen bildschirmorientierten Suchmaschinen. Dies kann Vorteile für NutzerInnen mit sich bringen, wie z.B. eine freihändige Bedienung, den schnellen Zugriff auf Informationen oder die Reduzierung der täglichen Bildschirmzeit (Zuberer, 2017). Es bietet außerdem eine Alternative für Menschen, die mit der klassischen Internetnutzung Schwierigkeiten haben, aufgrund des Alters oder körperlichen Einschränkungen. Jedoch gibt es dabei einige Aspekte, die berücksichtigt und kritisch diskutiert werden sollten.

Auditive Antworten von Sprachassistenten unterscheiden sich von angezeigten Ergebnissen auf einem Bildschirm. Im Vergleich zu einer textbasierten Suche, bei der die NutzerInnen eine Liste mit mehreren Suchergebnissen erhalten, die verglichen und beurteilt werden können, geben Sprachassistenten und Smart Speaker ohne Bildschirm in der Regel nur einzelne gesprochene Antworten. Dadurch werden NutzerInnen noch abhängiger vom Suchmaschinen-Algorithmus. Suchmaschinen zeigen hunderte von Ergebnissen an, aber bei der Nutzung von Sprachtechnologie wird meist nur eine Antwort hervorgehoben. Die anderen sind zunächst unsichtbar. Zusätzlich ist der Prozess der Auswahl von Antworten für NutzerInnen undurchsichtig. Es ist nicht klar, welche Hauptunterschiede zwischen dem besser untersuchten Mechanismus der Suchmaschinenoptimierung und dem Mechanismus bei sprachbasierter Suche sind. Unternehmen wie Amazon oder Apple, die hinter den Assistenten stehen, geben nur wenig Informationen darüber preis. Yao (2017) ist der Meinung, dass Ergebnisse nach den Prioritäten der Plattformbetreiber selbst ausgewählt werden.

Zudem wird die Quelle der wiedergegebenen Informationen bei der Beantwortung einer Frage teilweise nicht erwähnt, was es für NutzerInnen schwieriger macht, zu unterscheiden, wer für den Inhalt verantwortlich ist. Laut Metzger et al. (2003) macht die Unkenntnis über eine Informationsquelle es für Menschen schwieriger zu beurteilen, ob man den Informationen vertrauen kann.

Forschung zu Glaubwürdigkeit im Internet hat gezeigt, dass z.B. das Design von Websiten, die Vollständigkeit der Informationen einer Website oder Hinweise wie Autorenangaben wichtig für die wahrgenommene Glaubwürdigkeit im Internet sind (Metzger et al., 2003). Bei der Verwendung eines Smart Speakers gibt es jedoch keine visuellen Hinweise und zum Teil auch keine Informationen über die Quelle oder den Autor der gegebenen Information, da nur eine einzelne akustische Antwort gegeben wird, die zur Einschätzung der Glaubwürdigkeit verwendet werden kann.

Doch noch ein weiterer Aspekt spielt bei der Nutzung von Smart Speakern eine Rolle. Auch soziale und emotionale Komponenten digitaler Assistenzsysteme gewinnen an Relevanz (Ferdinand & Jetzke, 2017). So berichtet beispielsweise Daren Grill, der bei Amazon als Produktdirektor für Alexa arbeitet, dass bereits 500000 Menschen seiner Alexa die Liebe gestanden haben (Turk, 2016). Weiter scheint es für viele AnwenderInnen gängige Praxis zu sein, Alexa einen guten Morgen zu wünschen oder sich nach einer Aufgabe für ihre Assistenz zu bedanken (Lopatovska & Williams, 2018). Durch die natürliche Interaktion mit dem Assistenten kann somit von Seiten der NutzerInnen eine irrationale soziale Nähe erzeugt werden, wodurch wiederum eine Art künstliche Vertrautheit geschaffen wird (Turk, 2016). Daraus ergibt sich jedoch die Frage, welche Bedeutung eine stärkere Bindung an den Assistenten für die Informationssuche und die wahrgenommene Glaubwürdigkeit haben kann.

Wie Sprachassistenten und Smart Speaker allgemein und die zuvor berichteten Faktoren die Suche nach Informationen und deren Bewertung verändern, stand bisher kaum im Fokus wissenschaftlichen Interesses und wird nun im Rahmen von digilog@bw vom Leibniz-Institut für Wissensmedien untersucht. Ziel des Projekts ist es, Erkenntnisse darüber zu gewinnen, wie NutzerInnen von Smart Speakern die Technologie im Kontext des Wissenserwerbs nutzen und wie die spezifischen Eigenschaften der Geräte wie Quellenauswahl, Ergebnispräsentation (auditiv und  einzelne Antworten) oder mögliche soziale Faktoren die Nutzung und Bewertung der Informationssuche durch die Nutzer beeinflussen. Eine wichtige Variable kann dabei auch die Medienkompetenz sein. Bisherige Forschung hat sich insbesondere auf die Entwicklung von Medienkompetenz bei Kindern und Jugendlichen konzentriert. Die schnelle Entwicklung der Digitalisierung macht es jedoch nötig, auch die Medienkompetenz von Erwachsenen zu messen und ihre Effekte auf die wissensbezogene Nutzung digitaler Medien wie Sprachassistenten in Alltagssituationen zu untersuchen.

 

Literatur:

Ferdinand, J.-P., & Jetzke, T. (2017). Voice Computing – allgegenwärtige Spracherkennung. Das Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag (TAB), (15), 8.

Gentemann, L. (2018). Digitale Sprachassistenten. In Bitcom e.V. (Hrsg.), Zukunft der Con-sumer Technology – 2018 (S. 8–15).

Lopatovska, I., & Williams, H. (2018). Personification of the Amazon Alexa: BFF or a Mind-less Companion. In Proceedings of the 2018 Conference on Human Information In-teraction & Retrieval (S. 265–268). doi: 10.1145/3176349.3176868

Metzger, M. J., Flanagin, A. J., Eyal, K., Lemus, D. R., & Mccann, R. M. (2003). Credibility for the 21st Century: Integrating Perspectives on Source, Message, and Media Credibility in the Contemporary Media Environment. Annals of the International Communication Association, 27(1), 293–335. https://doi.org/10.1080/23808985.2003.11679029

Postbank. (2019, 12 Juni). Postbank Digitalstudie 2019: Ein Drittel der Deutschen spricht mit Alexa, Sir und Co. [Pressemeldung]. Abgerufen von https://www.presseportal.de/pm/6586/4295010

Stafford, M., & Thompson, J. W. (2017). Speak Easy. The Future Answers to you. - A con-sumer trends and insight report on voice technology and its impact on brands. Abge-rufen 22. April 2018, von https://www.mindshareworld.com/sites/default/fi-les/Speakeasy.pdf

Smarte Lautsprechern in Deutschland 2019. (2019). Statista. Abgerufen 2. März 2020, von https://de.statista.com/prognosen/983723/umfrage-in-deutschland-zum-besitz-eines-smart-speakers

Turk, V. (2016). Home invasion. New Scientist, 232(3104–3106), 16–17.

Yao, R. (2017, October 13). Voice Search vs. Visual Search. Medium. Retrieved from https://medium.com/ipg-media-lab/voice-search-vs-visual-search-42e7e99f46cf

Zuberer, S. (2017). Digitale Assistenten Bevölkerungsumfrage 2017. PwC Communica-tions. Abgerufen von https://www.pwc.de/de/consulting/management-consulting/pwc-befragung-digitale-assistenten-2017.pdf

Partner

  • GESIS - Leibnitz-Institut für Sozialwissenschaften
  • IDS - Leibnitz-Institut für Deutsche Sprache
  • Internationales Zentrum für Ethik in den Wissenschaften (IZEW)
  • IWM – Leibniz-Institut für Wissensmedien
  • KIT – Karlsruher Institut für Technologie
  • Universität Mannheim
  • ZEW – Leibniz-Zentrum für Europäische Wirtschaftsforschung
  • Logo ZKM | Zentrum für Kunst und Medien

Partner

Gefördert vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg aus
Mitteln der Landesdigitalisierungsstrategie digital@bw.

  • Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg
  • Landesdigitalisierungsstrategie digital@bw