Datenanalyse
Die Datenanalyse ist ein breites Konzept, das eine große Auswahl unterschiedlicher Prozesse und Techniken umfasst. Ein Datenanalyseziel kann unter Umständen auf mehrere Arten erreicht werden. Der Prozess ist insgesamt oft iterativ, d.h. Sie müssen Ihren ersten Ansatz auf Basis von Informationen, die Sie im weiteren Verlauf erhalten, anpassen.
Effektive Datenanalyse
In ihrer einfachsten Definition ist die Datenanalyse der Prozess der Suche nach Antworten auf Fragen über bestimmte Daten. Analytics stellt Ihnen einige Befehle und andere Tools zur Verfügung. Diese können Sie verwenden, um Erkenntnisse über die untersuchten Daten zu erhalten und spezifische Antworten auf Fragen zu finden. Sie sollten jedoch nicht erwarten, dass Sie in Analytics lediglich zwei oder drei Schaltflächen anklicken müssen, um auf magische Weise eine Antwort auf alle Ihre datenbezogenen Fragen zu finden.
Eine effektive Datenanalyse verlangt
- das Verständnis der Art der Daten
- die Formulierung spezifischer Analyseziele
- das sachgerechte Anwenden der Tools
Analytics kann Ihre Datenanalysefähigkeiten beträchtlich erweitern, sie jedoch nicht ersetzen.
Datenanalysebefehle und Tools in Analytics
Die folgende Tabelle kategorisiert Analytics-Befehle und Tools nach Datenanalysebereichen. Sie sollten diese Kategorien nicht als strikte Vorgabe betrachten. Möglicherweise können Sie einen Befehl auch effektiv außerhalb seiner Kategorie verwenden. Einige Befehle, wie beispielsweise das Sortieren und die Zusammenführung, haben einen Hauptzweck, der nicht primär der Analyse dient. In manchen Situationen können sie trotzdem analytische Erkenntnisse liefern.
Hinweis
Falls eine Datenanalyse über ihre einfachste Ausprägung hinausgeht, umfasst sie in der Regel eine Reihe von Befehlen, die progressiv auf Ihr Analyseziel hinarbeiten, und nicht nur einen einzelnen isolierten Befehl.
| Datenanalysebereich | Befehl oder Tool | Beschreibung |
|---|---|---|
|
Allgemeine Charakteristiken |
Verwenden Sie diese Befehle, um allgemeine Charakteristiken eines Datasets zu erkennen, unter anderem auch:
|
|
| Zuverlässigkeit/Genauigkeit | Kalkulationsfelder | Kalkulationsfelder zur erneuten Berechnung und zur Überprüfung der Korrektheit berechneter Beträge innerhalb eines Datasets verwenden, wie beispielsweise Gesamtbeträge einschließlich Steuer |
| Isolation |
Filterung verwenden, um ein Dataset oder eine Datenverarbeitung auf eine Untermenge relevanter Datensätze zu beschränken Suche nutzen, um spezifische Werte in einem Dataset zu finden |
|
| Sequenzielle Reihenfolge | Sortierfolge | Testen, ob Daten sequenziell angeordnet sind, und Daten finden, welche die Reihenfolge nicht einhalten |
| Vollständigkeit | Lücken | Überprüfen, ob alle Datensätze in einer Sortierfolge, wie beispielsweise sequenziell angeordnete Schecks, vorhanden sind, und Lücken innerhalb der Sortierfolge identifizieren |
| Eindeutigkeit | Duplikate | Erkennen, ob doppelte Werte oder Elemente in einem Feld bzw. vollständige doppelte Datensätze existieren |
| Ungenauigkeit | Fuzzy-Duplikate | Nahezu identische Werte identifizieren, die auf dieselbe tatsächliche Entität verweisen |
|
Häufigkeitsverteilung Konzentration von Wesentlichkeit |
Datensätze gruppieren sowie ermitteln, wie viele Datensätze und welche Werte auf einen Zeitraum, Wertebereich, ein Cluster oder Datensatzkennungen (wie z.B. Standortcodes, Lieferanten-/Kundennummern oder Produktkennungen) konzentriert sind Auch hilfreich, um Ausreißer zu finden |
|
| Vergleich | Tabellen vereinen, um festzustellen, ob Datensätze über Tabellen hinweg Übereinstimmungen aufweisen oder nicht, wie beispielsweise eine Rechnungstabelle und eine Bestelltabelle | |
| Numerische Anomalie | Benford | Ungewöhnliche numerische Daten entdecken, indem eine Abweichung führender Ziffern von der erwarteten Benford-Verteilung getestet wird |