Skip to main content

The Data Economist Blog (DE) | Etablierung einer Data Inspired & Digital Culture

Tücken bei Migrationsprojekten

Gastbeitrag von Ingo Lenzen, Leiter InfoZoom Academy

Wer hat Schuld an schlechten Daten im neuen System?

Jedes Migrationsprojekt, bei dem bestehende Daten in neue Systeme übertragen werden, hat  Hürden zu überwinden. Das gilt für den Adressimport genauso wie für den Artikelimport. Dabei sind häufig Stammdaten-Plausibilisierungen für die Folgearbeiten sehr wichtig. Sind erst Doubletten oder falsche Daten im System, kommen Fehler und Probleme nach und nach zum Vorschein. Aber wie kann ich tausende Datensätze auf einmal prüfen? Wie bringe ich einen Kunden dazu, in vorgelagerte Bereinigungen zu investieren? Intelligente Tools zeigen Lösungen auf.

Status quo in Projekten

Datenüberprüfung in Projekten ist  mühselig und zeitraubend. Seien wir ehrlich: Sind erste 40.000 Datensätze nach dem Datenimport händisch  oder halbautomatisiert überprüft, sind die restlichen nur lästiges Beiwerk und erhalten oft nicht die nötige Aufmerksamkeit. Es fehlt die Zeit und der Kunde drängt. Das zieht Kosten nach sich. Fehler sind vorprogrammiert. Den Kunden können wir nun emotional darauf vorbereiten, dass es eine „never ending story“ der Nachbereitung gibt. Der Kunde ist nämlich selbst nicht in der Lage, eine Überprüfung der Daten alleine zu bewerkstelligen. Von Beziehungen, Kennungen und Inhalten von Datentabellen des Systems hat er kaum Ahnung. Und das Schlimmste ist, dass der Kunde sich nach einem viertel Jahr nicht mehr daran erinnert, dass es seine Datenbasis war, die einen reibungslosen Start verhindert hat. War die Erwartungshaltung eine Importbereinigung zu bezahlen am Anfang nicht erwünscht und auch nicht der Wille  da, so etwas zu bezahlen, wird das später ein „das hätten Sie uns aber sagen müssen“Thema.  

Zusammenhänge werden nicht erkannt

Viele Artikel werden in vorherigen Systemen irgendwann unübersichtlich. Krücken und Dateileichen sind vorhanden. Dummyartikel wurden in der Vergangenheit viel genutzt und keiner kann sagen, wofür sie überhaupt gut waren. Da bleibt nur so ein Gefühl von „die müssten wir eigentlich auch nochmal angucken“. Außerdem sind Rabatte und andere Sonderfälle häufig an Artikel oder Artikelgruppen geknüpft. Diese werden dann aber in einer neuen Software nicht selten anders „gestrickt“. Eine Umsetzung der Altdaten in die neue Struktur ist hier unumgänglich. Nur, hat man auch alle erwischt und sind die vielen Abhängigkeiten berücksichtigt worden? Auch diese „Querplausibilisierung“ ist ohne Software-Unterstützung quasi nicht machbar.    Alle Daten auf einen Blick Anders sieht es aus, wenn schon vor dem Import die Plausibilisierungen effizient vorgenommen werden. Die Qualität wird im Vorfeld gestärkt. Der Kunde erhält keinen „Schrott“ in sein neues System. Jeder nicht doppelt importierte Datensatz spart Kosten, Zeit und Ärger.

Den Überblick über alle Daten erhalten Sie aber nicht mit einer herkömmlichen Tabellenkalkulation oder maskenbasierten Systemen. Erst recht nicht bei einer Million Datensätzen oder mehr. Nur, wenn Sie alle Daten auf einem Bildschirm haben, schnell und effizient Regeln zusammenstellen und anpassen können, haben Sie die Vorteile auf Ihrer Seite. Eine mögliche Lösung bietet eine Idee des Fraunhofer Instituts (FIT) aus Sankt Augustin: Die entwickelte Software (InfoZoom) setzt sich direkt auf die Datenbestände auf und spiegelt die Daten in den Arbeitsspeicher. Alle Daten werden mit einem Klick auf den Bildschirm komprimiert. Sie „vergessen“ keine Daten und sehen sofort Verteilungen, fehlende Daten oder Zusammenhänge. Nach der Bearbeitung und Bereinigung der Daten, werden in die neue Struktur exportiert. Die bereinigten Daten stehen für den Import bereit.

Fazit

Die Tragweite fehlerhafter Migrationsdaten und dem schulterzuckenden Einlesen derselben – weil „der Kunde sie ja schließlich so geliefert hat“ - ist nicht zu unterschätzen. Jedes noch so angespannte Projekt wegen etwaiger Umsetzungsschwierigkeiten krankt später zusätzlich an genau diesen Dingen. Und wenn das neue System irgendetwas aufgrund der Importdaten macht, was es aber nicht machen soll, interessiert es den Kunden herzlich wenig, ob das von seinen schlechten Daten kommt. Entscheidend ist, dass Sie als Durchführer wissen „müssen“, was wie umzusetzen und kombiniert zu beachten ist. Dazu braucht es die Unterstützung der IT, die den Mensch beim Aufspüren von Problemen unterstützt – und zwar vor dem Import der Daten.

Datenqualität, Migration, InfoZoom

  • Geändert am .
  • Aufrufe: 8337