Recherche d'omissions

Information de concept

Commande GAPS

Les omissions figurant dans des champs numériques ou DateHeure classés dans l'ordre séquentiel peuvent signaler qu'un fichier de données est incomplet. Il est possible de rechercher des omissions dans les valeurs d'un champ classées dans l'ordre séquentiel et identifier des omissions ou des éléments manquants, le cas échéant.

Pour que les résultats soient valides, le champ testé doit être dans l'ordre séquentiel avant le test. Vous pouvez trier un champ à l'avance ou bien utiliser l'option Prétrier pendant le test des omissions.

Vous pouvez tester des champs de type numérique ou de type DateHeure ou bien des nombres dans des champs de type caractère. Vous ne pouvez tester qu'un champ à la fois.

Afficher les plages d'omissions ou les éléments manquants

Deux possibilités s'offrent à vous pour la sortie des résultats de la recherche d'omissions :

  • Afficher les omissions
  • Afficher les éléments manquants

Afficher les omissions

Cette option identifie les points de départ et de fin d'une omission ainsi que le nombre total d'éléments manquants dans celle-ci.

Les valeurs identifiant les points de départ et de fin de l'omission ne sont pas des éléments manquants eux-mêmes. Ce sont les valeurs séquentielles qui apparaissent immédiatement avant et immédiatement après l'omission, elles sont libellées Début d'omission (exclu) et Fin d'omission (exclu). Par exemple, les numéros de chèque 12345 et 12350 identifieraient une omission de quatre éléments manquants entre ces deux numéros.

Afficher les éléments manquants

Cette option affiche chacun des éléments manquants dans une omission. Par exemple, les numéros de chèque 12346, 12347, 12348 et 12349.

Ces éléments manquants sont des valeurs calculées qui n'apparaissent pas réellement dans les données testées. Lorsque vous utilisez cette option, le champ Maximum d'éléments manquants vous permet de spécifier le nombre maximal d'éléments manquants à afficher individuellement pour chaque omission, ce qui s'avère utile en cas d'omission volumineuse. Si la valeur maximale est dépassée, Analytics utilise à la place la méthode de plage permettant d'identifier les omissions, à la seule différence que les valeurs identifiant les points de départ et de fin de l'omission sont les premier et dernier éléments, de façon séquentielle, libellés Début d'omission (inclus) et Fin d'omission (inclus).

Remarque

Le nombre que vous spécifiez dans Maximum d'éléments manquants s'applique à chaque omission. Il ne limite pas le nombre total de résultats d'éléments manquants dans un jeu de données, qu'il s'affiche individuellement ou par plage.

Lorsque vous utilisez la méthode des éléments manquants, les résultats peuvent contenir un mélange d'éléments manquants individuels et de plages en fonction de la valeur figurant dans le champ Maximum d'éléments manquants et de la taille des différentes omissions.

Recherche d'omissions dans des données numériques

Lorsque vous recherchez des omissions dans des données numériques, le nombre de décimales dans les données régit l'intervalle autorisé dans les données :

  • données numériques contenant uniquement des entiers (aucune partie décimale) l'intervalle autorisé est 1

    Un intervalle supérieur à 1 est une omission. Pour les omissions signalées comme étant des plages, le nombre d'éléments manquants est le nombre d'entiers manquants.

  • les données numériques contiennent des décimales l'intervalle autorisé est équivalent au plus petit intervalle de décimale

    Par exemple, si un champ numérique a deux décimales, l'intervalle autorisé est 0,01. Un intervalle supérieur au plus petit intervalle de décimale est une omission. Pour les omissions signalées comme étant des plages, le nombre d'éléments manquants est le nombre d'intervalles de décimale manquants.

Exemples de recherche d'omissions dans des données numériques

Dans le premier exemple, les données numériques contiennent uniquement des entiers. L'intervalle autorisé est 1.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

-2

-1

0

1

4

5

15

2

3

6 (à) 14 (inclus)

1 (entier)

1 (entier)

9 (entiers)

Dans le deuxième exemple, les données numériques contiennent deux décimales. L'intervalle autorisé est 0,01.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

4,24

4,25

4,26

4,29

4,30

5,00

4,27

4,28

4,31 (à) 4,99 (inclus)

1 (intervalle de 0,01)

1 (intervalle de 0,01)

69 (intervalles de 0,01)

Recherche d'omissions dans des données de type DateHeure

Vous pouvez rechercher des omissions dans les données de type date, DateHeure ou heure :

  • L'intervalle autorisé dans les champs de type date est un jour

    Un intervalle supérieur à un jour est une omission. Pour les omissions signalées en tant que plages, le nombre d'éléments manquants est le nombre de jours manquants.

  • L'intervalle autorisé dans les champs de type DateHeure ou heure est une seconde

    Un intervalle supérieur à une seconde est une omission. Pour les omissions signalées en tant que plages, le nombre d'éléments manquants est le nombre de secondes manquantes. Ainsi, une omission d'une heure serait signalée en tant que plage de 3 600 éléments manquants, une omission d'une journée serait signalée en tant que plage de 86 400 éléments manquants.

Exemples de recherche d'omissions dans des dates et des DateHeure

Dans le premier exemple, les données contiennent uniquement des dates. L'intervalle autorisé est un jour.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

27 déc 2014

28 déc 2014

31 déc 2014

01 jan 2015

02 jan 2015

12 jan 2015

13 jan 2015

29 déc 2014

30 déc 2014

03 jan 2015 (à) 11 jan 2015 (inclus)

1 (jour)

1 (jour)

9 (jours)

Dans le deuxième exemple, les données contiennent des DatesHeures. L'intervalle autorisé est une seconde.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

31 déc 2014 23:59:54

31 déc 2014 23:59:55

31 déc 2014 23:59:58

31 déc 2014 23:59:59

01 jan 2015 01:00:00

01 jan 2015 01:00:01

02 jan 2015 01:00:02

31 déc 2014 23:59:56

31 déc 2014 23:59:57

01 jan 2015 00:00:00 (à) 01 jan 2015 00:59:59 (inclus)

01 jan 2015 01:00:02 (à) 02 Jan 2015 01:00:01 (inclus)

1 (seconde)

1 (seconde)

3 600 (secondes)

86 400 (secondes)

Recherche d'omissions dans les données numériques contenues dans un champ de type caractère

Vous pouvez rechercher des omissions dans des données numériques apparaissant dans un champ de type caractère, par exemple, des numéros de chèque, qui sont généralement mis en forme en tant que données de type caractère.

Si des lettres et des nombres apparaissent en même temps dans un champ de type caractère, seuls les nombres sont testés, les lettres sont ignorées.

Exemples de recherche d'omissions dans les nombres contenus dans un champ de type caractère

Remarquez comment les préfixes alphabétiques sont ignorés et notez que seuls les nombres sont pris en compte.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

A123

C124

 

0 (nombre de caractères)

A123

B125

124

1 (nombre de caractères)

Le tri des champs de type caractère peut affecter les tests des omissions

En fonction de l'organisation des lettres et des nombres dans les valeurs des champs de type caractère, il se peut que des anomalies existent parmi les résultats de la recherche d'omissions. Par exemple, si certains nombres sont précédés d'une lettre, et d'autres non, ou si dans l'édition non Unicode d'Analytics certaines lettres précédentes sont en minuscules et d'autres en majuscules, il se peut que les résultats ne soient pas exacts.

Cette inexactitude est due à la présence incohérente de caractères alphabétiques, ou à leur casse incohérente, qui empêche les nombres d'être classés de façon séquentielle par l'option Prétrier. Dans le tableau suivant, 126 et 127, ainsi que 124, ne sont pas réellement des éléments manquants, mais, suite à la façon dont les chaînes alphanumériques sont triées, ils sont renvoyés en tant qu'éléments manquants.

Si vous soupçonnez l'existence d'une anomalie, effectuez une opération de tri distincte sur le champ en question pour afficher la séquence de valeurs de champ de type caractère dans laquelle une recherche d'omissions est en cours. Si un ordre numérique séquentiel est interrompu par la présence de lettres, vous pouvez garantir la validité des résultats à l'aide d'une fonction Analytics comme INCLUDE( ) pour démanteler les lettres avant de lancer la recherche d'omissions.

Exemples de résultats d'omissions incorrects

Remarquez comment la présence incohérente de caractères alphabétiques ou comment la casse incohérente des caractères alphabétiques fait que les éléments sont signalés, à tort, comme étant manquants.

Valeurs de test

Éléments manquants

Nombre d'éléments manquants

123

124

125

128

129

A-126

A-127

126

127

1 (nombre de caractères)

1 (nombre de caractères)

A-123

a-124

A-125

A-128

A-129

A-126

A-127

124

1 (nombre de caractères)

Étapes

Vous pouvez tester un seul champ à la fois dans la table active afin de déterminer si les nombres ou valeurs DateHeure classées par ordre séquentiel contiennent des omissions.