Efetuar análise de Benford

Informações do conceito

Comando BENFORD

A análise de Benford conta o número de vezes que cada dígito (1 a 9) ou combinação de dígitos à esquerda ocorre em um campo e compara a contagem real à contagem esperada.

A contagem esperada é calculada usando a fórmula de Benford e fornece a distribuição de Benford. Em um conjunto de números que ocorre naturalmente, a distribuição da frequência da contagem real de dígitos à esquerda deve se aproximar da distribuição de Benford.

Se um ou mais dígitos ou combinações de dígitos à esquerda nos dados testados desviarem substancialmente da distribuição de Benford, isso pode indicar que os números foram manipulados. Os desvios podem ter explicações simples e razoáveis e não indicam necessariamente manipulação.

Quais dados posso testar usando a análise de Benford?

Use a análise de Benford apenas para testar dados numéricos que consistem em "números que ocorrem naturalmente" como valores contábeis, valores de transações, despesas ou números de endereços. A análise de Benford não é adequada a dados numéricos restritos de qualquer forma.

Siga as diretrizes a seguir para identificar dados numéricos adequados à análise de Benford:

  • Tamanho do conjunto de dados O conjunto de dados deve ser grande o suficiente para oferecer suporte a uma distribuição válida. A análise de Benford pode não fornecer resultados confiáveis para menos de 500 registros.
  • Requisito de dígito à esquerda É necessário que todos os números de 1 a 9 possam ocorrer como dígito à esquerda.
  • Requisito de combinação de dígito à esquerda É necessário que todos os números de 0 a 9 possam ocorrer como o segundo dígito à esquerda e como qualquer dígito sendo analisado.
  • Dados restritos Dados numéricos atribuídos ou gerados de acordo com um padrão pré-ordenado não são adequados para a análise de Benford. Por exemplo, não utilize a análise de Benford para analisar:
    • números sequenciais de cheques ou faturas
    • números de previdência social ou de telefone mapeados a um padrão específico
    • qualquer esquema de numeração com um intervalo que evita que certos números sejam exibidos
  • Números randômicos Números gerados por um gerador de números randômicos não são adequados para a análise de Benford.

Detalhes de uso

A tabela a seguir oferece detalhes sobre o uso no recurso de análise de Benford no Analytics.

Área funcional Detalhes
Quantidade de dígitos à esquerda Você pode analisar até seis dígitos à esquerda. Na análise de quatro ou mais dígitos à esquerda, a saída da análise de Benford deve ser enviada a um arquivo em vez de ser exibida na tela ou enviada para uma impressora.
Tempo de processamento Dependendo do número de registros envolvidos, a análise de cinco ou mais dígitos à esquerda pode demorar vários minutos. Independentemente do número de dígitos analisado, é possível pressionar Esc a qualquer momento para encerrar o comando.
Tamanho do conjunto de dados Para ser eficaz, a análise de Benford exige grandes conjuntos de dados. O Analytics exibe um aviso na saída dos resultados quando um conjunto de dados é possivelmente pequeno demais para o número de dígitos especificado.
Valores positivos e negativos Dados anômalos são mais evidentes quando valores positivos e negativos são analisados separadamente. Você pode usar um filtro para separar os dois antes de iniciar a análise.
Zeros e caracteres não numéricos

Registros com valores de zero são ignorados, mas o número desses registros ignorados é informado.

Zeros à esquerda, formatações numéricas como casas decimais e símbolos de moeda, outros dígitos não numéricos e registros que não atendem aos critérios de teste também são ignorados. Se o número de dígitos resultante for menor que o especificado, o Analytics adicionará zeros à direita do resultado.

Resultados de saída da análise de Benford

A análise de Benford gera os seguintes resultados de saída:

Área funcional Detalhes
Dígitos à esquerda Exibe os dígitos à esquerda testados. Por exemplo, se você especificar um dígito à esquerda, serão exibidos os números 1 a 9. Se você especificar dois dígitos à esquerda, serão exibidos os números 10 a 99.
Contagem real Exibe a contagem de cada dígito ou combinação de dígitos à esquerda encontrados no campo.
Contagem esperada Exibe a contagem esperada de cada dígito ou combinação de dígitos à esquerda calculada pela fórmula de Benford.
Razão de estatística Z Exibe a razão de estatística Z de cada dígito ou combinação de dígitos, que mede a distância entre a contagem real e a contagem esperada, em desvios padrão. Por exemplo, uma estatística Z de 0,500 representa metade de um desvio padrão.

Limite inferior

Limite Superior

(opcional)

Exibe os valores calculados dos limites inferior e superior da contagem de cada dígito ou combinação de dígitos à esquerda.

Se a contagem real de mais de um dígito ou combinação de dígitos nos resultados exceder um dos limites, os dados poderão ter sido manipulados e devem ser investigados.

Nota

Os valores de Limite inferior e Limite superior serão incluídos somente se a caixa de seleção Incluir limite superior e inferior for marcada na caixa de diálogo Benford.

Etapas

Execute a análise de Benford em um campo para descobrir se um ou mais dígitos ou combinações de dígitos à esquerda nos dados testados desviam substancialmente da distribuição de Benford.