Datenanalyse

Die Datenanalyse ist ein breites Konzept, das eine große Auswahl unterschiedlicher Prozesse und Techniken umfasst. Ein Datenanalyseziel kann unter Umständen auf mehrere Arten erreicht werden. Der Prozess ist insgesamt oft iterativ, d.h. Sie müssen Ihren ersten Ansatz auf Basis von Informationen, die Sie im weiteren Verlauf erhalten, anpassen.

Effektive Datenanalyse

In ihrer einfachsten Definition ist die Datenanalyse der Prozess der Suche nach Antworten auf Fragen über bestimmte Daten. Analytics stellt Ihnen einige Befehle und andere Tools zur Verfügung. Diese können Sie verwenden, um Erkenntnisse über die untersuchten Daten zu erhalten und spezifische Antworten auf Fragen zu finden. Sie sollten jedoch nicht erwarten, dass Sie in Analytics lediglich zwei oder drei Schaltflächen anklicken müssen, um auf magische Weise eine Antwort auf alle Ihre datenbezogenen Fragen zu finden.

Eine effektive Datenanalyse verlangt

  • das Verständnis der Art der Daten
  • die Formulierung spezifischer Analyseziele
  • das sachgerechte Anwenden der Tools

Analytics kann Ihre Datenanalysefähigkeiten beträchtlich erweitern, sie jedoch nicht ersetzen.

Datenanalysebefehle und Tools in Analytics

Die folgende Tabelle kategorisiert Analytics-Befehle und Tools nach Datenanalysebereichen. Sie sollten diese Kategorien nicht als strikte Vorgabe betrachten. Möglicherweise können Sie einen Befehl auch effektiv außerhalb seiner Kategorie verwenden. Einige Befehle, wie beispielsweise das Sortieren und die Zusammenführung, haben einen Hauptzweck, der nicht primär der Analyse dient. In manchen Situationen können sie trotzdem analytische Erkenntnisse liefern.

Hinweis

Falls eine Datenanalyse über ihre einfachste Ausprägung hinausgeht, umfasst sie in der Regel eine Reihe von Befehlen, die progressiv auf Ihr Analyseziel hinarbeiten, und nicht nur einen einzelnen isolierten Befehl.

Datenanalysebereich Befehl oder Tool Beschreibung

Allgemeine Charakteristiken

Prüfen

Anzahl

Summe

Profil

Statistik

Ausreißer

Sortieren

Index

Verwenden Sie diese Befehle, um allgemeine Charakteristiken eines Datasets zu erkennen, unter anderem auch:

  • Gültigkeit der Daten
  • Datensatzanzahl
  • Gesamtbeträge
  • Mindestwert, Maximalwert und Durchschnittsbeträge
  • Standardabweichung, Median, Modus und Quartilswerte
  • Ausreißer
  • Bereiche
  • Verteilung negativer und positiver Werte
  • Muster
Zuverlässigkeit/Genauigkeit Kalkulationsfelder Kalkulationsfelder zur erneuten Berechnung und zur Überprüfung der Korrektheit berechneter Beträge innerhalb eines Datasets verwenden, wie beispielsweise Gesamtbeträge einschließlich Steuer
Isolation

Filtern

Suchen

Filterung verwenden, um ein Dataset oder eine Datenverarbeitung auf eine Untermenge relevanter Datensätze zu beschränken

Suche nutzen, um spezifische Werte in einem Dataset zu finden

Sequenzielle Reihenfolge Sortierfolge Testen, ob Daten sequenziell angeordnet sind, und Daten finden, welche die Reihenfolge nicht einhalten
Vollständigkeit Lücken Überprüfen, ob alle Datensätze in einer Sortierfolge, wie beispielsweise sequenziell angeordnete Schecks, vorhanden sind, und Lücken innerhalb der Sortierfolge identifizieren
Eindeutigkeit Duplikate Erkennen, ob doppelte Werte oder Elemente in einem Feld bzw. vollständige doppelte Datensätze existieren
Ungenauigkeit Fuzzy-Duplikate Nahezu identische Werte identifizieren, die auf dieselbe tatsächliche Entität verweisen

Häufigkeitsverteilung

Konzentration von Wesentlichkeit

Schichtung

Alter

Klassifizieren

Summenstruktur

Kreuztabelle erstellen

Histogramm

Cluster

Datensätze gruppieren sowie ermitteln, wie viele Datensätze und welche Werte auf einen Zeitraum, Wertebereich, ein Cluster oder Datensatzkennungen (wie z.B. Standortcodes, Lieferanten-/Kundennummern oder Produktkennungen) konzentriert sind

Auch hilfreich, um Ausreißer zu finden

Vergleich

Zusammenführen

Fuzzy-Zusammenführung

Verbinden

Tabellen vereinen, um festzustellen, ob Datensätze über Tabellen hinweg Übereinstimmungen aufweisen oder nicht, wie beispielsweise eine Rechnungstabelle und eine Bestelltabelle
Numerische Anomalie Benford Ungewöhnliche numerische Daten entdecken, indem eine Abweichung führender Ziffern von der erwarteten Benford-Verteilung getestet wird