Geschrieben von Marco Geuer. Veröffentlicht in Blog - Datenqualität & Data Governance.

Das Datenqualitätsniveau bestimmt die Ergebnisqualität von Sprachassistenzsystemen

Wer "ja" zur Digitalisierung sagt, muss auch "ja" zu besserer Datenqualität sagen

"76% aller Organisationen glauben, dass ungenaue Daten ihre Fähigkeit behindert, ein herausragendes Kundenerlebnis zu bieten (Experian, DQ-Studie 2016)."

Alles deutet darauf hin, dass wir zukünftig immer stärker Sprachassistenzsysteme nutzen werden. Der prominenteste Vertreter ist Siri. Mit dem zunehmenden Erfolg zogen Google und Amazon nach. Im Bereich der Daten-Analyse ist der bekannteste Vertreter Watson von IBM. Weitere werden sicherlich folgen.

Je besser die Sprachassistenzsysteme unsere Sprache verstehen und immer besser die menschliche Sprache imitieren können, desto stärker werden wir bereit sein sie im täglichen Leben zu nutzen. Erst erledigten diese Systeme einfache Dinge wie z.B. Anrufen auf Sprachbefehl. Weiter geht es damit, dass wir sagen können, welche Musik wir gerne hören würden und die entsprechende Musik wird dann abgespielt. Zudem können Licht, Heizung und der Fernseher mittels Sprache gesteuert werden. Amazon geht mit den Produkten „Echo“ noch weiter und möchte uns darüber hinaus animieren zukünftig auch Bestellungen per Sprache aufzugeben.

Wenn es nach IBM geht, werden Manager für Geschäftsentscheidungen Zahlen und Analysen zukünftig nicht mehr bei Controllern anfordern sondern vermehrt per Sprache bei „Watson“. Watson soll nicht nur Analyseergebnisse per Sprache zurückgeben, sondern auch Handlungsempfehlungen aussprechen können.

Eines muss man sich aber vor Augen führen und bewusst machen. Die Ergebnisqualität und der Informationswert mittels Sprachassistenzsystemen übermittelt, ist abhängig von der Datenqualität. (Das heiß diskutierte Thema IT-Security und der Schutz solcher Systeme vor Abhörung und Manipulation sei hier erst einmal ausgeklammert.)

Nehmen wir das einfache Beispiel, einen Anruf per Sprache zu initiieren. Ist die gespeicherte Telefonnummer fehlerhaft oder fehlt sogar, so werde ich meinen Anruf nicht durchführen können. Intelligente Systeme könnten jetzt versuchen aus dem Internet oder einer öffentlichen Telefondatenbank die richtige Nummer zu ermitteln. Ist aber auch hier die Telefonnummer fehlerhaft oder zusätzlich die hinterlegte Adresse falsch, werde ich auch in diesem Fall nicht zum Ziel kommen.

Schauen wir uns die Auswirkung von Datenqualitätsproblemen im Falle einer per Sprache initiierten Bestellung an. „Hey …, bitte bestelle 1 Paket Toilettenpapier, a´ 10 Rollen pro Paket zum aktuell besten Preis.“ Mit diesen Anforderungen fallen somit alle Anbieter raus, die nicht 10 Rollen in einem Paket haben und oder nicht den besten Preis. Wenn es jetzt einen Anbieter gibt, der zwar den besten Preis gehabt hätte, aber durch einen Datenfehler (z.B. fehlerhafte Eingabe oder veraltete Daten) nicht auf Top 1 (= bester Preis) gelistet ist, wird dieser Anbieter aufgrund eines Datenqualitätsproblems nicht zum Zuge kommen.

Bei einer klassischen Internetrecherche würde das Problem natürlich auch heute schon auftreten. Allerdings wiegt das Problem bei Sprachassistenten schwerer. Angenommen, der Anbieter kommt mit dem falschen Preis immerhin unter die Top 3, dann würde ich Kenntnis davon erlangen, weil ich den Anbieter in der Liste sehen kann. Wenn dieser eine bessere Kunden-Bewertungen hat, als der preislich Erstplatzierte, dann könnte der Anbieter doch noch in Frage kommen. Wenn nicht, besteht zumindest ein Marketingeffekt und der Anbieter kommt schon aufgrund der guten Kunden-Bewertungen zukünftig wieder in die engere Wahl. Dass ich über Sprachassistenten weitere Informationen entsprechend meiner Bedürfnisse zu weiteren Anbieter erhalte ist zwar möglich, aber zur Zeit noch nicht technisch ausgereift. Dies bedeutet, dass Anbieter mit Datenfehlern entweder nicht in die engere Auswahl kommen oder durch einen irrtümlich zu niedrig angegeben Preis zwar zum Zuge kommen, aber die gewünschte Marge nicht erzielt wird. Egal wie man es dreht, schlechte Datenqualität zieht Schäden nach sich.

Doppelt ärgerlich, wenn Unternehmen viel Aufwand ins Marketing gesteckt haben, so dass diese auch in die engere Bestellauswahl bei der Nutzung von Sprachassistenzsystemen kommen, aber durch einen Datenqualitätsfehler doch rausfallen. Das ganze Marketing war somit umsonst.

Genau so problematisch ist das Thema Datenqualität bei Analysen und deren Ergebnissen per Sprachassistent. Hier hat der Manager keine Wahl, als sich auf das gesprochene Wort zu verlassen, während bei visueller Ergebnispräsentation noch eher Datenqualitätsprobleme erkannt werden können.

Organisationen empfehle ich, das Datenqualitätsniveau bei der Präsentation von Analyseergebnissen und deren Einfluss auf das Ergebnis transparent darzulegen. Dies ermöglicht Entscheidern zu Bewerten, wie weit sie sich auf das Datenmaterial stützen können. Zusätzlich fördert ein sich stetig verbessernder Datenqualitätsindex das Vertrauen in die Kennzahlensysteme.

Diese Empfehlung gilt erst recht für den Einsatz von Sprachassistenzsystemen. Ohne ein dahinterliegendes Datenqualitätsmanagement und einen Hinweis seitens des Sprachassistenten zum Datenqualitätsniveau und den Einfluss auf die Ergebnisse, werden wir keine echte Verbesserung in der Informationsverarbeitung und der Entscheidungsfindung erlangen. Sind die Daten schlecht, sind die Informationen wertlos, egal über welches System die Ergebnisse präsentiert werden.

Lesen Sie auch:

Wie Sie schnell bewerten können, ob Sie ein Problem mit der Datenqualität haben

Logikbäume: Mehr Transparenz zur Wirkung schlechter Datenqualität auf Unternehmensziele

Datenqualität, Business Intelligence, Business Analytics, Big Data, Datenqualitätsmanagement

Geändert am 23. Januar 2017.
Aufrufe: 10778

The Data Economist Blog (DE) | Etablierung einer Data Inspired & Digital Culture

Das Datenqualitätsniveau bestimmt die Ergebnisqualität von Sprachassistenzsystemen

Wer "ja" zur Digitalisierung sagt, muss auch "ja" zu besserer Datenqualität sagen

Marco Geuer

Cookie-Einstellungen

Funktional

Präferenzen

Statistik

Marketing