Realización de un análisis de Benford

Información de concepto

Comando BENFORD

El análisis de Benford cuenta la cantidad de veces que aparece cada dígito inicial (1-9) o combinación de dígitos iniciales en un campo y compara el recuento real con el recuento esperado.

El recuento esperado, que se calcula con la fórmula de Benford, ofrece la distribución de Benford. En conjuntos de números que aparecen de manera natural, la distribución de la frecuencia del recuento real de los dígitos iniciales debe ser aproximada a la distribución de Benford.

Si uno o más dígitos iniciales o combinaciones de dígitos iniciales de los datos que se están comprobando se desvía de manera significativa de la distribución de Benford, es posible que los números hayan sido manipulados. Las desviaciones también pueden tener explicaciones simples y razonables, y no son necesariamente un indicio de manipulación.

¿Qué datos puedo comprobar usando el análisis de Benford?

Solo debe usar el análisis de Benford para comprobar los datos numéricos conformados por "números que ocurren naturalmente", como importes contables, importes de transacciones, gastos o números de domicilio. El análisis de Benford no es adecuado para los datos numéricos que tienen algún tipo de limitación.

Tenga en cuenta las siguientes pautas para identificar los datos numéricos que son adecuados para el análisis de Benford:

  • Tamaño del conjunto de datos El conjunto de datos debe ser lo suficientemente extenso como para permitir una distribución válida. Es posible que el análisis de Benford no arroje resultados confiables con menos de 500 registros.
  • Requisito del dígito inicial Todos los números del 1 al 9 deben tener la posibilidad de aparecer como el dígito inicial.
  • Requisito de la combinación de dígitos inicial Todos los números del 0 al 9 deben tener la posibilidad de aparecer como el segundo dígito inicial y como el resto de los dígitos que se están analizando.
  • Datos limitados Los datos numéricos que se asignan o generan de acuerdo con un patrón preordenado no son adecuados para el análisis de Benford. Por ejemplo, no use el análisis de Benford para analizar lo siguiente:
    • números de factura o cheques en secuencia
    • números de seguridad social o de teléfono que coinciden con un patrón específico
    • cualquier conjunto de números con un rango que impida que aparezcan ciertos números
  • Números aleatorios Los números generados por un generador de números aleatorios no son adecuados para el análisis de Benford.

Detalles de uso

La siguiente tabla ofrece detalles sobre el uso de la función de análisis de Benford en Analytics.

Área funcional Detalles
Número de dígitos iniciales Puede analizar hasta seis dígitos iniciales. Al analizar cuatro o más dígitos iniciales, la salida del análisis de Benford se debe enviar a un archivo en lugar de ser mostrada en la pantalla o enviada a una impresora.
Tiempo de procesamiento Según la cantidad de registros con los que esté trabajando, el análisis de cinco o más dígitos iniciales puede demorar varios minutos. Sin importar cuántos dígitos esté analizando, puede pulsar Esc para dar por finalizado el comando cuando lo desee.
Tamaño del conjunto de datos El análisis de Benford efectivo requiere grandes conjuntos de datos. Analytics muestra una advertencia en la salida de los resultados cuando un conjunto de datos puede ser demasiado pequeño para la cantidad de dígitos especificada.
Valores positivos y negativos Los datos anómalos se detectan mejor al analizar los valores negativos y positivos por separado. Puede utilizar un filtro para separar ambos valores antes de comenzar el análisis.
Ceros y caracteres no numéricos

Los registros con valores de cero se ignoran, pero existe un reporte con la cantidad de registros con valor de cero que se ignoraron.

También se ignoran los ceros iniciales, los formatos de números (como los signos de dólar y de decimales), otros dígitos no numéricos y los registros que no cumplen con los criterios de la prueba. Si la cantidad de dígitos resultante es inferior a la especificada, Analytics agrega ceros a la derecha del resultado.

Resultados de la salida del análisis de Benford

El análisis de Benford produce los siguientes resultados de salida:

Área funcional Detalles
Dígitos iniciales Muestra los dígitos iniciales que se probaron. Por ejemplo, si especifica un dígito inicial, se muestran los números del 1 al 9. Si especifica dos dígitos iniciales, se muestran los números del 10 al 99.
Recuento real Muestra el recuento real de cada dígito inicial o combinación de dígitos iniciales en el campo.
Recuento esperado Muestra el recuento esperado de cada dígito inicial o combinación de dígitos iniciales que se calcula con la fórmula de Benford.
Valor estadístico Z Muestra el valor estadístico Z para cada dígito o combinación de dígitos, que es una medida de la distancia entre el recuento real y el recuento esperado expresada en desviaciones estándar. Por ejemplo, una estadística Z de 0,500 representa la mitad de una desviación estándar.

Limite inferior

Límite superior

(opcional)

Muestra los valores límite superior e inferior calculados para el recuento de cada dígito o combinación de dígitos inicial.

Si el recuento real de más de un dígito o combinación de dígitos de los resultados de la salida supera cualquiera de estos límites, es posible que los datos hayan sido manipulados y es necesaria una investigación.

Nota

Los valores Límite inferior y Límite superior se incluyen únicamente si se selecciona la casilla de verificación Incluir límites superior e inferior en el cuadro de diálogo Benford.

Pasos

Realice el análisis de Benford en un campo para determinar si uno o más dígitos iniciales o combinación de dígitos se desvían de manera significativa de la distribución de Benford.