benford() methode
Telt het aantal keren dat elk eerste cijfer (1-9), of combinatie van eerste cijfers, voorkomt in een numerieke kolom, en vergelijkt het werkelijke aantal met het verwachte aantal. De verwachte telling wordt berekend met behulp van de Benford-formule.
Syntaxis
dataframe_name.benford(on = "numeric_column", leading = number_of_digits, addbounds = Waar|Onwaar)
Parameters
Naam | Beschrijving |
---|---|
on = "numeric_column" |
De numerieke kolom om te analyseren. Opmerking Selecteer een kolom die "van nature voorkomende getallen" bevat, zoals transactiebedragen. Benford-analyse is niet geschikt voor numerieke gegevens die op enigerlei wijze beperkt zijn. |
leading = number_of_digits optioneel |
Het aantal leidende cijfers dat moet worden geanalyseerd. Als u leading weglaat, wordt de standaardwaarde van 1 gebruikt. |
addbounds = Waar | Onwaar optioneel |
Als twee of meer tellingen in de uitvoerresultaten een van de grenzen overschrijden, zijn de gegevens mogelijk gemanipuleerd en moeten ze worden onderzocht. Als u de parameter weglaat, worden de boven- en ondergrenswaarden niet opgenomen. |
Retourneert
HCL-dataframe.
Voorbeelden
Een numerieke kolom testen op onregelmatigheden in het eerste cijfer
U gebruikt de benford()-methode om de eerste twee cijfers in de kolom Hoeveelheid te testen op afwijking van de verwachte aantallen:
accounts_receivable.benford(on = "Bedrag", leading = 2, addbounds = True)