Análisis de datos

"Análisis de datos" es un concepto amplio que comprende una gran cantidad de procesos y técnicas diferentes. Puede existir más de una manera de lograr el mismo objetivo de análisis de datos. El proceso general suele ser iterativo y usted debe modificar su enfoque inicial basándose en la información que descubra a lo largo del procedimiento.

Análisis de datos efectivo

En su nivel más básico, el análisis de datos es el proceso de encontrar respuestas a preguntas acerca de los datos. Analytics ofrece una serie de comandos y otras herramientas que usted puede usar para obtener información general sobre los datos que está investigando y para responder a preguntas específicas. Sin embargo, debe resistir la idea de que puede hacer clic en dos o tres botones de Analytics y obtener mágicamente todas las respuestas de su análisis de datos.

Para lograr un análisis de datos efectivo es necesario lo siguiente:

  • comprender la naturaleza de los datos
  • formular objetivos de análisis específicos
  • aplicar las herramientas con conocimiento

Analytics puede amplificar de manera significativa sus capacidades de análisis de datos, pero no las reemplaza.

Comandos y herramientas para el análisis de datos en Analytics

La siguiente tabla clasifica los comandos y las herramientas de Analytics por área de análisis de datos. Las categorías no son absolutas. Puede encontrar un uso efectivo para un comando fuera de su categoría. Algunos comandos, como Ordenar y Unir, cumplen un propósito principal que no es fundamentalmente analítico, pero en algunas situaciones, pueden ofrecer información de estudio analítico.

Nota

En general, el análisis de los datos que busca llegar más allá de lo básico requiere el uso de comandos para avanzar de manera progresiva hacia el objetivo del análisis más que usar un comando único de manera aislada.

Área de análisis de datos Comando o herramienta Descripción

Características generales

Verificar

Recuento

Total

Perfil

Estadísticas

Valores atípicos

Ordenar

Índice

Use estos comandos para descubrir las características generales de un conjunto de datos, incluidas las siguientes:

  • validez de los datos
  • recuento de registros
  • cantidades totales
  • cantidades mínima, máxima y promedio
  • (desviación estándar, mediana, moda, primer y tercer cuartil)
  • valores atípicos
  • rangos
  • distribución de valores positivos y negativos
  • patrones
Confiabilidad/Precisión campos calculados Use campos calculados para volver a calcular y probar la precisión de las cantidades calculadas en un conjunto de datos, como los importes totales con los impuestos incluidos
Aislamiento

filtración

realizar búsquedas

Use los filtros para restringir un conjunto de datos o el procesamiento de datos a un subconjunto de registros de interés

Use la búsqueda para encontrar valores específicos en un conjunto de datos

Orden secuencial Secuencia Pruebe si los datos están ordenados en secuencia e identifique los elementos que no se encuentran dentro de la secuencia
Integridad Faltantes Verifique si están presentes todos los registros de una secuencia, como una serie de cheques ordenados en secuencia, e identifique la ubicación de cualquier faltante en la secuencia
Unicidad Duplicados Identifique elementos o valores duplicados en un campo o registros enteros duplicados
Inexactitud Duplicados inexactos Identifique valores casi idénticos que puedan hacer referencia a la misma entidad en el mundo real

Distribución de la frecuencia

Concentración de la materialidad

Estratificar

Antigüedad

Clasificar

Resumir

Generar tablas cruzadas

Histograma

Clúster

Agrupe registros y determine la cantidad de registros y de valor que se concentran por rango numérico o clúster, por período de tiempo o por identificadores de registros, como códigos de ubicación, número de proveedor o cliente, o identificadores de productos

También es útil para identificar valores atípicos

Comparar

Unir

Unir inexactos

Relacionar

Combine tablas para descubrir si los registros de las tablas concuerdan o no; por ejemplo, una tabla de facturas y una tabla de órdenes de compra
Anomalía numérica Benford Descubra los datos numéricos anómalos probando los dígitos iniciales en busca de una varianza respecto de la distribución de Benford esperada