Durchführen einer Benford-Analyse

Konzept-Informationen

BENFORD-Befehl

Benford-Analysen werden verwendet, um zu zählen, wie oft jede führende Ziffer (1–9) oder führende Ziffernkombination in einem Feld vorkommt, und um das tatsächliche mit dem erwarteten Ergebnis zu vergleichen.

Das erwartete Ergebnis wird mit der Benford-Formel errechnet und setzt eine Benford-Verteilung voraus. In einer natürlich auftretenden Zahlenmenge sollte die Häufigkeitsverteilung der tatsächlich auftretenden führenden Ziffern ungefähr der Benford-Verteilung entsprechen.

Wenn eine oder mehrere führende Ziffern oder Ziffernkombinationen der getesteten Daten wesentlich von der Benford-Verteilung abweichen, könnte dies andeuten, dass die Zahlen manipuliert wurden. Abweichungen können auch einfache und vernünftige Erklärungen haben, müssen sich also nicht eindeutig aus Manipulationen ergeben.

Welche Daten kann ich mit der Benford-Analyse testen?

Sie sollten die Benford-Analyse nur für Tests numerischer Daten verwenden, die sich aus „natürlich auftretenden Zahlen“ zusammensetzen, wie beispielsweise Beträge in der Buchführung, Transaktionsbeträge, Spesen oder Adressnummern. Die Benford-Analyse eignet sich nicht für numerische Daten, die auf irgendeine Weise eingeschränkt sind.

Folgen Sie diesen Richtlinien, um numerische Daten zu identifizieren, die sich für die Benford-Analyse eignen.

  • Größe des Datasets Das Dataset muss groß genug sein, um eine gültige Verteilung zu unterstützen. Für weniger als 500 Datensätze liefert die Benford-Analyse unter Umständen keine verlässlichen Ergebnisse.
  • Anforderung führender Ziffern Alle Ziffern von 1 bis 9 müssen als führende Ziffer auftreten können.
  • Anforderung führender Zifferkombination Alle Ziffern von 0 bis 9 müssen als zweite führende Ziffer und als jede zusätzliche, zu analysierende Ziffer auftreten können.
  • Eingeschränkte Daten Numerische Daten, die nach einem zuvor bestimmten Muster zugewiesen oder erstellt werden, eignen sich nicht für die Benford-Analyse. Verwenden Sie beispielsweise Benford nicht zur Analyse von:
    • sequenziellen Scheck- oder Rechnungsnummern
    • Sozialversicherungsnummern oder Telefonnummern, die ein bestimmtes Muster aufweisen
    • jedem Nummerierungsschema, dessen Bereich das Auftreten bestimmter Zahlen verhindert
  • Zufallszahlen Durch einen Zufallszahlen-Generator generierte Zahlen eignen sich nicht für die Benford-Analyse.

Nutzungsdetails

Die folgende Tabelle enthält Einzelheiten über die Verwendung der Benford-Analyse in Analytics.

Funktionsbereich Details
Anzahl der führenden Ziffern Sie können bis zu sechs führende Ziffern analysieren. Bei der Analyse von vier oder mehr führenden Ziffern muss das Ergebnis der Benford-Analyse an eine Datei gesendet werden und kann nicht auf dem Bildschirm angezeigt oder auf einem Drucker ausgegeben werden.
Verarbeitungszeit Abhängig vin der Anzahl der von Ihnen bearbeiteten Datensätze dauert die Analyse von fünf oder mehr führenden Ziffern möglicherweise mehrere Minuten. Unabhängig von der Anzahl der analysierten Ziffern können Sie jederzeit Esc drücken, um den Befehl zu beenden.
Größe des Datasets Für eine effektive Benford-Analyse sind große Datensets erforderlich. Analytics zeigt in der Ergebnisausgabe eine Warnung an, wenn ein Dataset möglicherweise zu klein für die angegebene Anzahl von Ziffern ist.
Positive und negative Werte Regelwidrige Daten sind offensichtlicher, wenn Sie positive und negative Werte gesondert analysieren. Mit Hilfe eines Filters können Sie die beiden vor Beginn der Analyse trennen.
Nullen und nicht numerische Zeichen

Datensätze mit dem Wert Null werden ignoriert, aber die Anzahl der übergangenen Datensätze mit dem Wert Null wird gemeldet

Führende Nullen, numerische Formatierung wie Dezimal- oder Währungszeichen, andere nicht-numerische Zeichen und Datensätze, die die Testkriterien nicht erfüllen, werden ebenfalls ignoriert. Wenn die resultierende Anzahl von Ziffern kleiner als die angegebene Anzahl ist, fügt Analytics Nullen rechts vom Ergebnis hinzu

Ausgabeergebnisse der Benford-Analyse

Die Benford-Analyse liefert die folgenden Ausgabeergebnisse:

Funktionsbereich Details
Führende Ziffern Zeigt die führenden Ziffern an, die getestet wurden. Wenn Sie beispielsweise eine führende Ziffer angeben, werden die Nummern 1 bis 9 angezeigt. Wenn Sie zwei führende Ziffern angeben, werden die Nummern 10 bis 99 angezeigt.
Tatsächliche Anzahl Zeigt die tatsächliche Anzahl jeder führenden Ziffer oder führenden Ziffernkombination an, die im Feld gefunden werden.
Erwartete Anzahl Zeigt die erwartete Anzahl jeder führenden Ziffer oder Kombination aus führenden Ziffern an, die von der Benford-Formel berechnet wurde.
Zstat-Verhältnis Zeigt das Z-Stat-Verhältnis für jede Ziffer oder Ziffernkombination an. Dabei handelt es sich um eine Messung der Distanz zwischen der tatsächlichen und der erwarteten Anzahl, ausgedrückt in Standardabweichungen. Beispiel: Eine Z-Statistik mit 0,500 repräsentiert die Hälfte einer Standardabweichung.

Untergrenze

Obere Grenze

(optional)

Zeigt die berechneten oberen und unteren Grenzwerte für die Anzahl aller führenden Ziffern oder Zifferkombinationen an, die im Feld gefunden werden.

Wenn die tatsächliche Anzahl von mehr als einer Ziffer oder Ziffernkombination in den Ausgabeergebnissen die Grenzen überschreitet, könnten die Daten manipuliert worden sein und sollten untersucht werden.

Hinweis

Die Werte der unteren Grenze und oberen Grenze werden nur aufgenommen, wenn im Dialogfeld Benford das Kontrollkästchen Obere und untere Grenzen mit einbeziehen aktiviert ist.

Schritte

Führen Sie eine Benford-Analyse für ein Feld aus, um herauszufinden, ob eine oder mehrere führende Ziffern oder Ziffernkombinationen wesentlich von der Benford-Verteilung abweichen.