Metodo benford()

Conta il numero di volte in cui ciascuna cifra iniziale (1–9) o combinazione di cifre iniziali si verifica in una colonna numerica e confronta il conteggio effettivo con quello previsto. Il conteggio effettivo viene calcolato con la formula di Benford.

Sintassi

dataframe_name.benford(on = "numeric_column", leading = number_of_digits, addbounds = True|False)

Parametri

Nome Descrizione
on = "numeric_column"

La colonna numerica da analizzare.

Nota

Selezionare una colonna che contenga "numeri naturalmente presenti", ad esempio gli importi delle transazioni. L'analisi di Benford non è adatta a dati numerici che presentano vincoli di alcun tipo.

leading = number_of_digits

facoltativo

Il numero di cifre iniziali da analizzare.

Se si omette leading, verrà utilizzato il valore predefinito 1.

addbounds = True | False

facoltativo

  • True (Vero): includere i valori limite superiore e inferiore calcolati nei risultati di output
  • False (False): non includere i valori limite superiore e inferiore nei risultati di output

Se due o più conteggi nei risultati di output superano uno dei limiti, i dati potrebbero essere stati manipolati e devono essere analizzati.

Se si omette il parametro, i valori limite superiore e inferiore non verranno inclusi.

Restituisce

Dataframe HCL.

Esempi

Testare una colonna numerica per irregolarità nelle cifre iniziali

Si utilizza il metodo benford() per verificare se le prime due cifre nella colonna Quantità si discostano dai conteggi previsti:

accounts_receivable.benford(on = "Amount", leading = 2, addbounds = True)