Ansätze für eine systematische Untersuchung

Aus XIMES

Wechseln zu: Navigation, Suche
Bild: HomeLink.gif Startseite Bild: HandbuchIcon.gif Grundbegriffe Bild: HandbuchIcon.gif Operationen Bild: VorlageSolutionIcon.gif Vorlage



Hinweise

  • Leitfaden zum systematischen Vorgehen zur Datenanalyse mit [TIS] in 4 Schritten
  • Es kommt immer wieder zu Rücksprüngen zwischen den Schritten. Die Reihenfolge ist nur die Haupt-Marschrichtung.


Inhaltsverzeichnis

Schritt 1 ⇒ Aufbereitung

Der Schritt Aufbereitung soll den sauberen Zugriff auf Daten erlauben.

Teilschritt Zu tun? Beschreibung Beispiel
Daten und ihr Zusammenspiel, sowie die Quellen beschreiben Immer
  • Datei mit 63.456 Zeilen am 17.3.8 von XY... eingespielt. Der Inhalt sieht exemplarisch folgendermaßen aus ...
  • Die Daten wurden in folgender Weise erhoben ...
  • Mögliche Schwächen der Erhebung sind
Daten und Quellen
Daten und Quellen
Arbeitsabläufe in der Übersicht oft Wie ist die Gesamstruktur der Abläufe und Prozesse im Zusammenspiel mit der Erhebung.
Prozess [1]
Prozess [1]
Alle Daten an EINER Stelle und genau einmal einlesen Immer Eine Stelle ist wichtig, dass bei Updates nicht versehentlich nur ein Teil aktualisiert wird
Import
Import
In Standardisierte Form bringen Immer TIS:Grundbegriffe:Standardformen
Zeitbereichsauswahl Fallweise z.B. für alle Datenquellen überschneidende Bereiche wählen, oder entsprechende Teilbestände zusammen holen
Zeitraum wähen nach Datum oder relativ
Zeitraum wähen nach Datum oder relativ
Recodierungen zu Identifizierern oder zu Zeit Fallweise
  • z.B. von 1000 verschiedenen Warengruppen auf 5 verdichten.
  • z.B. statt detaillierter Zeitstempel Recodierung auf Werktag, Vormittag, Nachmittag, Abend ...
  • z.B. Vorbereitung verschiedene Gruppierungen in Auswertung zu bringen (Stadt-Land; Einkaufsstraße - Shoppingcenter, ...)
Recodierung
Recodierung
Datenreinigung für jede einzelne Datenspalte Immer
  • Ausreißer, Löcher, Korrektur... herausnehmen. Besser zu viele als zu wenige Extremwerte heraus nehmen, auf Extremwerten sollte eine Analyse nur insofern nicht aufbauen.
  • Glättung mit z.B. TIS:Glättung insbesondere bei Zeitrastern
  • Wenn bestimmte Verfahren nicht mit Lücken umgehen können, dann die fehlenden Werte ergänzen, aber diese Ergänzungen markieren, so dass nachvollziehbar bleibt was ergänzt/korrigiert wurde.
  • Wenn bestimmte Visualisierungen durch Lücken unlesbar/schlecht lesbar werden, dann ebenso Daten ergänzen.
Beispiel Suche nach Ausreissern
Beispiel Suche nach Ausreissern
Datenreinigung für Datenspalten im Zusammenspiel Immer
  • z.B. unplausible Zusammenhänge: Verkaufsdaten, obwohl keine Mitarbeiter im Dienst
  • z.B. unplausible Annahmen: Wenn ein Verkauf z.B. 7Minuten dauert, hätte dann Zahl Mitarbeiter z.B. Montag früh ausgereicht um diese Leistung zu erbringen
Check Daten im Zusammenspiel
Check Daten im Zusammenspiel
Aufsummieren oder Differenzen berechnen, Zusammenziehen von Zeiten Fallweise
  • Aufsummieren z.B. von Ereignisdaten zu Gesamtzahlen (z.B. wie viele Personen sind im Geschäft basierend auf Eingangs- und Ausgangsdaten)
  • Differenzieren: z.B. Veränderung der Geschwindigkeit und des Lagerstandes statt dessen Wertes
  • Viele kleine Zeiten zu einer längeren Zusammen ziehen (z.B. kleine Arbeiten zu Schicht)
  • Aus zwei Datenreihen eine berechnen: Z.B. aus Stunden Arbeitszeit und Stück könnte Stück/Stunde gerechnet werden
Beispiel: Differenz zu Durchschnittswert
Beispiel: Differenz zu Durchschnittswert
Plausibilitätscheck immer Sind Gesamtmengen, Gesamtsummen, etc. plausibel. - Quervergleich zu bekannten Zahlen, um mehr Sicherheit zu gewinnen.
Plausibilitätsprüfung
Plausibilitätsprüfung



Schritt 2 ⇒ Normalisierung

Normalisierung hat den Sinn den sauberen Vergleich vorzubereiten, so dass nicht Äpfel mit Birnen verglichen werden. Das kann zu zusätzlichen Datenbeständen für die Auswertung führen.

Teilschritt Zu tun? Beschreibung Beispiele
Die zu verwendenden Datenspalten und Kennzahlen (verdichtet: Auslastung, roh) Immer Was ist/sind Indikatoren für erbrachte Leistung?
Mit entsprechender Tagtypenunterscheidung, Markierung fehlerhafter Daten/Zeitzonen. Kernfrage: Gibt es weitere Tagtypen UND/ODER Trends: Immer

Wichtige zu prüfende UNTERSCHEIDUNGEN:

  • Unterschiede der Wochentage
  • Saisonale Muster wie z.B. Sommer/Winter, Ferien/Nichtferien
  • Vor Ereignis (11.9.), nach Ereignis
  • langfristige Trends
  • Monatsrhythmus (z.B. Monatsbeginn, Monatsende, Banktage, ...)
  • Feiertage und Tage um Feiertage
  • ...

Wichtige anwendbare METHODEN:

  • Übersicht in Visualisierung
  • Hypothesen in verschiedenen Zeiträumen

Wichtige anwendbare TECHNIKEN

  • Landkarte
  • Summengrafiken auf verschiedener Granularität, Zyklizität (z.B. Jahre im Verlauf zueinander)
Was ist die kleinste angemessene Einheit der Analyse? Immer
  • Zu prüfen: Problem versetzter Erfassung von Arbeiten/Ereignissen - z.B. unregelmässige erfasste Leistungen (z.B. in Pausen) oder systematisch später erfasse Leistungen (z.B. Kassadaten mit vorhergehender Beratung, die aber nicht erfast wird).
  • Zu prüfen: Problem unterschiedlicher Zeitraster - siehe auch TIS:Zeitrasterkonvertierung
Was sind die richtigen Kennzahlen der Analyse? Immer
  • Z.B. Summen oft verzerrt durch unterschiedliche Zahl zugrundeliegender Daten
  • Z.B. Auslastung oft verzerrt durch geringe Zahl zugrundeliegender Daten
Was sind die richtigen Grenzen der Tagestypen? Immer Ist Mitternacht ein guter Wechselpunkt oder wäre ein anderer Zeitpunkt für den "Tagesbeginn", "Wochenbeginn" besser? - Z.B. endet bei der Polizei Freitag Nacht in der Regel nicht um 00:00
Umgang mit fehlerhaften Daten Immer
  • Wie müssen Berechnungen angepasst werden, um z.B. fehlende Daten richtig auszugleichen?
  • Wo fließen auch unplausible Werte wieder ein (z.B. Kassa Nachbuchungen können in Tagessummen einfliessen aber nicht in tageszeitliche Betrachtung)
Umgang mit Zeitzonen, Sommerzeit/Winterzeit, sich verändernden Zeiten Selten Z.B. Korrektur für diese Faktoren oder Berechnung von Werten relativ zu sich verschiebenden Ereignissen (z.B. Sonnenaufgang)



Schritt 3 ⇒ Prüfung von Hypothesen zur zeitlichen Struktur

Bei den Auswertungen geht es um die eigentlichen Ergebnisse. Sie werden durchgeführt für

  1. jeden Datenbestand getrennt
  2. Zusammenspiel von Datenbeständen


Die folgende Liste soll nur eine Anregung sein und ist eine kleine Auswahl wichtiger Behauptungen/Prüfungen.
Die Auswertungen erfolgt nach Tagytpen getrennt (z.B. Montage/Werktage ... ohne Feiertage - je nach Ergebnis der Untersuchungenim Bereich Normalisierung.

Behauptung Zu tun? Wie zu prüfen?
Arbeitszeit, Bedarf, Auslastung ... beträgt im Zeitbereich immer
  • Summen im Verlauf über die Zeit
  • Summen im Verlauf mit den Zeitzyklen im Vergleich - z.B. Jahreskurven im Vergleich
  • Vorlagenordner_D Wie oft waren wie viele Personen da - bzw. Ereignisse?
Arbeitszeit, Bedarf, Auslastung ... schwankt/schwankt regelmäßig / ist konstant immer
  • Summen im Verlauf über die Zeit
  • Summen im Verlauf mit den Zeitzyklen im Vergleich - z.B. Jahreskurven im Vergleich
  • Kreuztabelle
Arbeitszeit, Bedarf, Auslastung ... hat bestimmte Muster des Auftretens, des Abweichens von Plan immer
  • Summen im Verlauf über die Zeit
  • Landkarte
  • Vorlagenordner_D Wochentage nach Tageszeit im Vergleich
  • Summen im Verlauf mit den Zeitzyklen im Vergleich - z.B. Jahreskurven im Vergleich
  • Vergleich der Tagesprofile nach Tagestypen
Der Zusammenhang von A zu B ist ... oft
Einflussfaktor Schichtübergabe oft Vorlagenordner_D Wochentage nach Tageszeit im Vergleich
Start-, Endezeiten, Längen streuen, häufen sich, sind regelmässig, sind unbeeinflusst von ... oft
Prüfung auf Vorkommen - z.B. was ist Mindeststärke fallweise Z.B. Prüfung in der Jahresübersicht - wie war es in Urlaubszeiten



Schritt 4 ⇒ Bestimmung des zukünftigen Verlaufes

Verfahren Anmerkung
Bestimmung eines festen Schätzwertes für bestimmten Tagestyp
Entwicklung eines detaillierten Forecasts
  • Mit Verfahren aus der Vorlage Forecaster
  • plus händischen Eingriffen
Persönliche Werkzeuge