Exécution d'une analyse de Benford

Information de concept

Commande BENFORD

L'analyse de Benford compte le nombre d'occurrences de chaque chiffre de tête (1-9) ou combinaison de chiffres de tête dans un champ, et compare le compte réel au compte probable.

Le compte probable, calculé à l'aide de la formule de Benford, donne la loi de Benford. Dans un ensemble de nombres apparaissant naturellement, la répartition de la fréquence du compte réel de chiffres de tête doit être équivalente à la loi de Benford.

Si un ou plusieurs chiffres ou si une ou plusieurs combinaisons de chiffres des données testées s'écartent sensiblement de la loi de Benford, cela peut indiquer que les chiffres ont été manipulés. Il se peut aussi que les écarts aient des explications simples et acceptables qui n'indiquent pas forcément une manipulation.

Quelles données puis-je tester à l'aide d'une analyse de Benford ?

Vous devez uniquement utiliser une analyse de Benford pour tester des données numériques composées de « nombres apparaissant naturellement », tels que les montants comptables, les montants des transactions, les dépenses ou les numéros d'adresse. L'analyse de Benford ne convient pas aux données numériques limitées d'une manière ou d'une autre.

Suivez ces indications pour identifier les données numériques qui conviennent à l'analyse de Benford :

  • Taille du jeu de données Le jeu de données doit être suffisamment grand pour soutenir une répartition valide. Il se peut que les résultats d'une analyse de Benford ne soient pas très fiables pour des ensembles de moins de 500 enregistrements.
  • Condition du chiffre de tête Tous les chiffres compris entre 1 et 9 doivent avoir la possibilité d'apparaître comme chiffre de tête.
  • Condition de la combinaison des chiffres de tête Tous les chiffres compris entre 0 à 9 doivent avoir la possibilité d'apparaître comme deuxième chiffre de tête et comme un chiffre supplémentaire en cours d'analyse.
  • Données limitées Les données numériques qui sont affectées ou générées selon un modèle prédéterminé ne conviennent pas à l’analyse de Benford. Par exemple, n'utilisez pas Benford pour analyser les éléments suivants :
    • les numéros de chèques ou numéros de facture séquentiels
    • les numéros de sécurité sociale ou les numéros de téléphone qui correspondent à un modèle spécifique
    • tout modèle de numérotation présentant une plage empêchant l’apparition de certains chiffres
  • Nombres aléatoires Les nombres générés par un générateur de nombres aléatoires ne conviennent pas à l'analyse de Benford.

Informations sur l'utilisation

Le tableau ci-dessous fournit des détails sur la fonctionnalité de l'analyse de Benford dans Analytics.

Domaine fonctionnel Détails
Nombre de chiffres de tête Vous pouvez analyser jusqu'à six chiffres de tête. Lorsque vous analysez au moins quatre chiffres de tête, la sortie de l'analyse de Benford doit être envoyée dans un fichier plutôt qu'affichée sur écran ou envoyée vers une imprimante.
Durée de traitement Selon le nombre d'enregistrements que vous utilisez, l'analyse de cinq chiffres de tête ou plus peut prendre plusieurs minutes. En fonction du nombre de chiffres que vous analysez, vous pouvez appuyer sur Esc pour mettre fin à la commande à tout moment.
Taille du jeu de données Une analyse de Benford efficace demande de grands jeux de données. Analytics affiche un avertissement dans la sortie des résultats lorsqu'un jeu de données peut s'avérer trop petit pour le nombre de chiffres spécifié.
Valeurs positives et négatives Les données anormales sautent davantage aux yeux lorsque vous analysez séparément des valeurs positives et négatives. Vous pouvez utiliser un filtre pour séparer les deux types de valeurs avant de commencer votre analyse.
Zéros et caractères non numériques

Les enregistrements présentant des valeurs de zéro sont ignorés, mais leur nombre est indiqué.

Les zéros de tête, la mise en forme numérique comme les décimales et les symboles dollar, les autres caractères non numériques et les enregistrements ne répondant pas aux critères de test sont aussi ignorés. Si le nombre de chiffres apparaissant est inférieur à celui spécifié, Analytics ajoute des zéros à droite du résultat.

Résultats de sortie d'une analyse de Benford

L'analyse de Benford produit les résultats de sortie suivants :

Domaine fonctionnel Détails
Chiffres de tête Affiche les chiffres de tête qui ont été testés. Par exemple, si vous spécifiez un chiffre de tête, les nombres de 1 à 9 s'affichent. Si vous spécifiez deux chiffres de tête, les nombres de 10 à 99 s'affichent.
Compte effectif Affiche le compte réel de chaque chiffre de tête ou combinaison de chiffres de tête détecté dans le champ.
Compte probable Affiche le compte probable de chaque chiffre de tête ou combinaison de chiffres de tête calculé par la formule de Benford.
Ratio Z-stat Affiche le ratio Z-Stat pour chaque chiffre ou combinaison de chiffres, qui mesure en nombre d'écarts-types la distance séparant le compte réel du compte probable. Par exemple, une statistique Z de 0,500 représente la moitié d'un écart type.

Limite inférieure

Limite Supérieure

(facultatif)

Affiche les valeurs des limites inférieure et supérieure pour le compte de chaque chiffre de tête ou combinaison de chiffres de tête.

Si le compte réel de plusieurs chiffres ou combinaisons de chiffres dans les résultats de sortie dépasse l'une de ces limites, il se peut que les données aient été manipulées. Elles doivent donc faire l'objet d'une étude plus approfondie.

Remarque

Les valeurs Limite inférieure et Limite supérieure sont incluses uniquement si la case Inclure les limites supérieures et inférieures est cochée dans la boîte de dialogue Benford.

Étapes

Effectuez une analyse de Benford sur un champ pour découvrir si un ou plusieurs chiffres de tête ou combinaisons de chiffres de tête s'écartent sensiblement de la loi de Benford.