Análisis de datos
"Análisis de datos" es un concepto amplio que comprende una gran cantidad de procesos y técnicas diferentes. Puede existir más de una manera de lograr el mismo objetivo de análisis de datos. El proceso general suele ser iterativo y usted debe modificar su enfoque inicial basándose en la información que descubra a lo largo del procedimiento.
Análisis de datos efectivo
En su nivel más básico, el análisis de datos es el proceso de encontrar respuestas a preguntas acerca de los datos. Analytics ofrece una serie de comandos y otras herramientas que usted puede usar para obtener información general sobre los datos que está investigando y para responder a preguntas específicas. Sin embargo, debe resistir la idea de que puede hacer clic en dos o tres botones de Analytics y obtener mágicamente todas las respuestas de su análisis de datos.
Para lograr un análisis de datos efectivo es necesario lo siguiente:
- comprender la naturaleza de los datos
- formular objetivos de análisis específicos
- aplicar las herramientas con conocimiento
Analytics puede amplificar de manera significativa sus capacidades de análisis de datos, pero no las reemplaza.
Comandos y herramientas para el análisis de datos en Analytics
La siguiente tabla clasifica los comandos y las herramientas de Analytics por área de análisis de datos. Las categorías no son absolutas. Puede encontrar un uso efectivo para un comando fuera de su categoría. Algunos comandos, como Ordenar y Unir, cumplen un propósito principal que no es fundamentalmente analítico, pero en algunas situaciones, pueden ofrecer información de estudio analítico.
Nota
En general, el análisis de los datos que busca llegar más allá de lo básico requiere el uso de comandos para avanzar de manera progresiva hacia el objetivo del análisis más que usar un comando único de manera aislada.
| Área de análisis de datos | Comando o herramienta | Descripción |
|---|---|---|
|
Características generales |
Use estos comandos para descubrir las características generales de un conjunto de datos, incluidas las siguientes:
|
|
| Confiabilidad/Precisión | campos calculados | Use campos calculados para volver a calcular y probar la precisión de las cantidades calculadas en un conjunto de datos, como los importes totales con los impuestos incluidos |
| Aislamiento |
Use los filtros para restringir un conjunto de datos o el procesamiento de datos a un subconjunto de registros de interés Use la búsqueda para encontrar valores específicos en un conjunto de datos |
|
| Orden secuencial | Secuencia | Pruebe si los datos están ordenados en secuencia e identifique los elementos que no se encuentran dentro de la secuencia |
| Integridad | Faltantes | Verifique si están presentes todos los registros de una secuencia, como una serie de cheques ordenados en secuencia, e identifique la ubicación de cualquier faltante en la secuencia |
| Unicidad | Duplicados | Identifique elementos o valores duplicados en un campo o registros enteros duplicados |
| Inexactitud | Duplicados inexactos | Identifique valores casi idénticos que puedan hacer referencia a la misma entidad en el mundo real |
|
Distribución de la frecuencia Concentración de la materialidad |
Agrupe registros y determine la cantidad de registros y de valor que se concentran por rango numérico o clúster, por período de tiempo o por identificadores de registros, como códigos de ubicación, número de proveedor o cliente, o identificadores de productos También es útil para identificar valores atípicos |
|
| Comparar | Combine tablas para descubrir si los registros de las tablas concuerdan o no; por ejemplo, una tabla de facturas y una tabla de órdenes de compra | |
| Anomalía numérica | Benford | Descubra los datos numéricos anómalos probando los dígitos iniciales en busca de una varianza respecto de la distribución de Benford esperada |