Daten profilieren und überprüfen

Die Profilierungsbefehle ermöglichen Ihnen das Zählen von Datensätzen, die Summierung numerischer Felder und das Erstellen statistischer Datenprofile.

Überprüfungsbefehle bieten unterschiedliche Möglichkeiten, die Integrität eines Datasets zu untersuchen. Sie können beispielsweise eine Datenvalidierung durchführen oder die Daten auf sequenzielle Anordnung, Lücken und Duplikate testen.

Befehlsbeschreibungen

Befehl Beschreibung

BENFORD

Zählt, wie oft jede Anfangszahl (1–9) oder führende Zahlenkombination in einem Feld vorkommt, und vergleicht das tatsächliche mit dem erwarteten Ergebnis. Das erwartete Ergebnis wird mittels der Benford-Formel errechnet.

COUNT

Zählt die Gesamtanzahl der Datensätze in der aktuellen Ansicht oder nur der Datensätze, die bestimmte Bedingungen erfüllen.

DUPLICATES

Erkennt, ob doppelte Werte oder vollständige doppelte Datensätze in einer Analytics-Tabelle existieren.

FUZZYDUP

Sucht nahezu identische Werte (Fuzzy-Duplikate) in einem Zeichenfeld.

GAPS

Ermittelt, ob ein numerisches Feld oder ein Datumzeit-Feld in einer Analytics-Tabelle ein oder mehrere Lücken in sequenziellen Daten enthält.

OUTLIERS

Identifiziert statistische Ausreißer in einem numerischen Feld. Ausreißer können für das gesamte Feld identifiziert werden oder für unterschiedliche Gruppen, basierend auf identischen Werten in einem oder mehreren Zeichen-, Datumzeit-Schlüsselfeldern oder numerischen Schlüsselfeldern.

PROFIL

Berechnet Summenstruktur-Statistiken für ein oder mehrere numerische Felder oder numerische Ausdrücke in einer Analytics-Tabelle.

SEQUENCE

Bestimmt, ob ein oder mehrere Felder in einer Analytics-Tabelle in sequenzieller Folge vorliegen und identifiziert nicht sortierte Elemente.

STATISTICS

Berechnet Statistiken für ein oder mehrere numerische Felder oder Datumzeitfelder in einer Analytics-Tabelle.

TOTAL

Berechnet den Gesamtwert von ein oder mehreren Feldern einer Analytics-Tabelle.

ÜBERPRÜFEN

Prüft auf Datengültigkeitsfehler in einem oder mehreren Feldern der aktuellen Analytics-Tabelle, indem die Daten auf Konsistenz mit den Felddefinitionen im Tabellenlayout geprüft werden.