Vorlagenordner Cc ... Umbau von 11U in 11U: Datenbereinigung

Aus XIMES

Hauptseite > Time Intelligence Solutions > TIS: Templates > Vorlagenordner Cc ... Umbau von 11U in 11U: Datenbereinigung
Wechseln zu: Navigation, Suche


Vorlagen für Datenbereinigung

Inhaltsverzeichnis

Nr. + Ziel des Knotens Eingangs- und Ergebnisdaten Anmerkungen


Cc00

GRAFIK Startzeiten nach Wochentag

bild:Arrowblue.gif Eingangsdaten:

bild:Ba10result.gif


bild:Arrowgreenleft.gif Einstellungen:

bild:Cc00Setting.gif


bild:Arrowgreenleft.gif Ergebnis:

bild:Cc00result.gif

GEZEIGT WIRD:

  • Welche Sätze haben besonders hohe/niedrige Werte?

ANMERKUNG:

  • Es liessen sich natürlich auch nur die zeigen, die im Bereich liegen.

ANALYSE:

  • Kommen Extremwerte vor? Wie viele?
  • Gibt es vom Datum Häufigkeit --> eventuell Häufigkeit im Zeitverlauf danach auswerten.


Cc10

Doppelte Datensätze

bild:Arrowblue.gif Eingangsdaten:

bild:Ba00result.gif


bild:Arrowgreenleft.gif Einstellungen:

bild:Cc10Setting.gif
bild:Cc10Setting2.gif


bild:Arrowgreenleft.gif Ergebnis:

bild:Cc10result.gif

GEZEIGT WIRD:

  • Welche kommen mehrfach vor (besonders oft vor)?

ANMERKUNG:

  • Es liessen sich natürlich auch nur die zeigen, die 1mal vorkommen

ANALYSE:

  • Gibt es(die erwartet Zahl) doppelter Datensätze?
  • Fehlen Datensätze - zB Gegenbuchungen?


Cc20a, Cc20b, Cc20c, Cc20d, Cc20e

Missing Data bereinigen

bild:Arrowblue.gif Eingangsdaten: und CC20a

bild:Cc20a_result.gif
Da mehrere Auswertungen auf gleichen Datenbestand gemacht werden, die dann zusammen geführt werden, wird er hier zentral eingelesen.


bild:Arrowgreenleft.gif ZWISCHEN-Ergebnis: Tage mit zu vielen Buchungen:

bild:Cc20b_result.gif


bild:Arrowgreenleft.gif ZWISCHEN-Ergebnis: Tage mit zu wenigen Buchungen:

bild:Cc20c_result.gif


bild:Arrowgreenleft.gif ZWISCHEN-Ergebnis: Tage mit zu vielen oder zu wenigen Buchungen:

bild:Cc20d_result.gif


bild:Arrowgreenleft.gif Ergebnis: Um problematische Tage bereinigter Datenbestand

bild:Cc20e_result.gif

GEZEIGT WIRD:

  • Welche Daten bleiben bei diesen Kriterien über?

ANALYSE:

  • Gibt es - die erwartete Zahl - plausibler Tage?

ZU ÜBERLEGEN:

  • Umgang mit Missing Data - ergänzen oder ausklammern?


Cc30

Sehr kurze/lange Intervalle oder BIS Zeit vor VON-Zeit

bild:Arrowblue.gif Eingangsdaten:

bild:Ba00result.gif


bild:Arrowgreenleft.gif Einstellungen:

bild:Cc30settings.gif


bild:Arrowgreenleft.gif Ergebnis: bei Einstellung 3 Minuten

bild:Cc30result.gif

GEZEIGT WIRD:

  • Bei welchen Sätzen ist VON zu nah an BIS oder sogar nach BIS bzw. zu weit davon entfernt

ANMERKUNG:

  • Minutengrenze beliebig einstellbar
  • durch Deaktivieren der letzten Operation werden Minuten aufsteigend angezeigt

ANALYSE:

  • Gibt es solche Datensätze (sonst zeigt Berechnung Fehler an)


Cc40

Zeilen mit fehlenden BIS Zeit oder VON-Zeit raus

bild:Arrowblue.gif Eingangsdaten:

bild:Ba00result.gif


bild:Arrowgreenleft.gif Ergebnis:

bild:Ba00result.gif

GEZEIGT WIRD:

  • Zeilen wo in Von oder in Bis kein Wert steht, werden, rausgeworfen.

ANMERKUNG:

  • Fehlerwert ist der 1.1.1900 19:19 - falls dieser Wert in den Daten vorkommen kann, dann in Nullwerte und Formeloperator anpassen.
Persönliche Werkzeuge