Profiler et vérifier les données

Les commandes de type Profiler vous permettent de compter des enregistrements, de totaliser des champs numériques et de créer un profil statistique des données.

Les commandes Vérifier offrent différentes façons d'examiner l'intégrité d'un jeu de données. Par exemple, vous pouvez tester des données pour rechercher leur validité, une séquence de données, des omissions et des doublons.

Descriptions des commandes

Commande Description

BENFORD

Compte le nombre d'occurrences de chaque chiffre de tête (1-9) ou combinaison de chiffres de tête dans un champ, et compare le compte réel au compte probable. Le compte probable est obtenu en utilisant la formule Benford.

COUNT

Compte le nombre total d'enregistrements dans la vue active ou uniquement les enregistrements qui remplissent la condition spécifiée.

DUPLICATES

Détecte si des valeurs dupliquées ou des enregistrements entièrement dupliqués existent dans une table Analytics.

FUZZYDUP

Détecte des valeurs presque identiques (doublons approximatifs) dans un champ de type caractère.

GAPS

Détecte si un champ numérique ou DateHeure dans une table Analytics contient une ou plusieurs omissions dans des données séquentielles.

OUTLIERS

Identifie les valeurs statistiques aberrantes dans un champ numérique. Des valeurs aberrantes peuvent être identifiées pour le champ dans son ensemble ou pour des groupes distincts basés sur les valeurs identiques contenues dans un ou plusieurs champs clés de type caractère, numérique ou DateHeure.

PROFIL

Génère une synthèse des statistiques pour un ou plusieurs champs ou expressions numériques dans une table Analytics.

SEQUENCE

Détermine si un ou plusieurs champs d'une table Analytics sont classés par ordre séquentiel, et identifie les éléments hors séquence.

STATISTICS

Calcule des statistiques sur un ou plusieurs champs numériques ou DateHeure dans une table Analytics.

TOTAL

Calcule la valeur totale pour un ou plusieurs champs dans une table Analytics.

VÉRIFIER

Recherche des erreurs de validité de données dans un ou plusieurs champs d'une table Analytics, en vérifiant que les données sont cohérentes avec les définitions de champ dans le format de table.