Aus XIMES
Hauptseite >
Time Intelligence Solutions >
TIS: Templates > Vorlagenordner Cc ... Umbau von 11U in 11U: Datenbereinigung
Vorlagen für Datenbereinigung
| Nr. + Ziel des Knotens
| Eingangs- und Ergebnisdaten
| Anmerkungen
|
Cc00 GRAFIK Startzeiten nach Wochentag
|
Eingangsdaten:
Einstellungen:
Ergebnis:
|
GEZEIGT WIRD:
- Welche Sätze haben besonders hohe/niedrige Werte?
ANMERKUNG:
- Es liessen sich natürlich auch nur die zeigen, die im Bereich liegen.
ANALYSE:
- Kommen Extremwerte vor? Wie viele?
- Gibt es vom Datum Häufigkeit --> eventuell Häufigkeit im Zeitverlauf danach auswerten.
|
Cc10 Doppelte Datensätze
|
Eingangsdaten:
Einstellungen:
Ergebnis:
|
GEZEIGT WIRD:
- Welche kommen mehrfach vor (besonders oft vor)?
ANMERKUNG:
- Es liessen sich natürlich auch nur die zeigen, die 1mal vorkommen
ANALYSE:
- Gibt es(die erwartet Zahl) doppelter Datensätze?
- Fehlen Datensätze - zB Gegenbuchungen?
|
Cc20a, Cc20b, Cc20c, Cc20d, Cc20e Missing Data bereinigen
|
Eingangsdaten: und CC20a
- Da mehrere Auswertungen auf gleichen Datenbestand gemacht werden, die dann zusammen geführt werden, wird er hier zentral eingelesen.
ZWISCHEN-Ergebnis: Tage mit zu vielen Buchungen:
ZWISCHEN-Ergebnis: Tage mit zu wenigen Buchungen:
ZWISCHEN-Ergebnis: Tage mit zu vielen oder zu wenigen Buchungen:
Ergebnis: Um problematische Tage bereinigter Datenbestand
|
GEZEIGT WIRD:
- Welche Daten bleiben bei diesen Kriterien über?
ANALYSE:
- Gibt es - die erwartete Zahl - plausibler Tage?
ZU ÜBERLEGEN:
- Umgang mit Missing Data - ergänzen oder ausklammern?
|
Cc30 Sehr kurze/lange Intervalle oder BIS Zeit vor VON-Zeit
|
Eingangsdaten:
Einstellungen:
Ergebnis: bei Einstellung 3 Minuten
|
GEZEIGT WIRD:
- Bei welchen Sätzen ist VON zu nah an BIS oder sogar nach BIS bzw. zu weit davon entfernt
ANMERKUNG:
- Minutengrenze beliebig einstellbar
- durch Deaktivieren der letzten Operation werden Minuten aufsteigend angezeigt
ANALYSE:
- Gibt es solche Datensätze (sonst zeigt Berechnung Fehler an)
|
Cc40 Zeilen mit fehlenden BIS Zeit oder VON-Zeit raus
|
Eingangsdaten:
Ergebnis:
|
GEZEIGT WIRD:
- Zeilen wo in Von oder in Bis kein Wert steht, werden, rausgeworfen.
ANMERKUNG:
- Fehlerwert ist der 1.1.1900 19:19 - falls dieser Wert in den Daten vorkommen kann, dann in Nullwerte und Formeloperator anpassen.
|