Método benford()

Conta o número de vezes que cada dígito (1 a 9) ou combinação de dígitos à esquerda ocorre em uma coluna numérica e compara a contagem real à contagem esperada. O resultado esperado é calculado usando a fórmula de Benford.

Sintaxe

nome_dataframe.benford(on = "coluna_numérica", leading = número_de_dígitos, addbounds = True|False)

Parâmetros

Nome Descrição
on = "coluna_numérica"

A coluna numérica a ser analisada.

Observação

Selecione uma coluna que contém "números que ocorrem naturalmente", como valores de transação. A análise de Benford não é adequada a dados numéricos restritos de qualquer forma.

leading = número_de_dígitos

opcional

O número de dígitos à esquerda a serem analisados.

Se leading for omitido, o valor padrão de 1 será aplicado.

addbounds = True | False

opcional

  • True inclui valores calculados de limites superior e inferior nos resultados
  • False não inclui valores de limites superior e inferior nos resultados

Se duas ou mais contagens nos resultados excederem um dos limites, os dados podem ter sido manipulados e devem ser investigados.

Se o parâmetro for omitido, não serão incluídos valores de limites superior e inferior.

Retorna

Dataframe do HCL.

Exemplos

Testar se há dígitos à esquerda irregulares em uma coluna numérica

Use o método benford() para testar se há desvios em relação às contagens esperadas nos dois dígitos à esquerda na coluna Quantidade:

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)