Metodo benford()
Conta il numero di volte in cui ciascuna cifra iniziale (1–9) o combinazione di cifre iniziali si verifica in una colonna numerica e confronta il conteggio effettivo con quello previsto. Il conteggio effettivo viene calcolato con la formula di Benford.
Sintassi
dataframe_name.benford(on = "numeric_column", leading = number_of_digits, addbounds = True|False)
Parametri
Nome | Descrizione |
---|---|
on = "numeric_column" |
La colonna numerica da analizzare. Nota Selezionare una colonna che contenga "numeri naturalmente presenti", ad esempio gli importi delle transazioni. L'analisi di Benford non è adatta a dati numerici che presentano vincoli di alcun tipo. |
leading = number_of_digits facoltativo |
Il numero di cifre iniziali da analizzare. Se si omette leading, verrà utilizzato il valore predefinito 1. |
addbounds = True | False facoltativo |
Se due o più conteggi nei risultati di output superano uno dei limiti, i dati potrebbero essere stati manipolati e devono essere analizzati. Se si omette il parametro, i valori limite superiore e inferiore non verranno inclusi. |
Restituisce
Dataframe HCL.
Esempi
Testare una colonna numerica per irregolarità nelle cifre iniziali
Si utilizza il metodo benford() per verificare se le prime due cifre nella colonna Quantità si discostano dai conteggi previsti:
accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)