Método benford()
Conta o número de vezes que cada dígito (1 a 9) ou combinação de dígitos à esquerda ocorre em uma coluna numérica e compara a contagem real à contagem esperada. O resultado esperado é calculado usando a fórmula de Benford.
Sintaxe
nome_dataframe.benford(on = "coluna_numérica", leading = número_de_dígitos, addbounds = True|False)
Parâmetros
Nome | Descrição |
---|---|
on = "coluna_numérica" |
A coluna numérica a ser analisada. Observação Selecione uma coluna que contém "números que ocorrem naturalmente", como valores de transação. A análise de Benford não é adequada a dados numéricos restritos de qualquer forma. |
leading = número_de_dígitos opcional |
O número de dígitos à esquerda a serem analisados. Se leading for omitido, o valor padrão de 1 será aplicado. |
addbounds = True | False opcional |
Se duas ou mais contagens nos resultados excederem um dos limites, os dados podem ter sido manipulados e devem ser investigados. Se o parâmetro for omitido, não serão incluídos valores de limites superior e inferior. |
Retorna
Dataframe do HCL.
Exemplos
Testar se há dígitos à esquerda irregulares em uma coluna numérica
Use o método benford() para testar se há desvios em relação às contagens esperadas nos dois dígitos à esquerda na coluna Quantidade:
accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)