Verificando falhas

Informações do conceito

Comando GAPS

Falhas em campos numéricos ordenados sequencialmente ou em campos de datahora podem indicar que um arquivo de dados está faltando. Você pode testar se há falhas em valores ordenados sequencialmente em um campo e identificar uma ou mais falhas ou itens ausentes, caso existam.

Para que os resultados sejam válidos, o campo sendo testado deve estar em ordem sequencial antes do teste. Você pode ordenar um campo antes, ou utilizar a opção Pré-ordenação durante o teste de falhas.

Você pode testar campos numéricos ou de datahora, ou números em campos de caracteres. É possível testar somente um campo por vez.

Listar intervalos de falha ou itens ausentes

Você tem duas opções ao emitir os resultados do testes de falhas:

  • Listar intervalos de falha
  • Listar itens ausentes

Listar intervalos de falha

Esta opção identifica os pontos inicial e final de uma falha e o número total de itens ausentes na falha.

O valor que identifica os pontos inicial e final da falha não são itens ausentes por si mesmos. Eles são os valores sequenciais que aparecem imediatamente antes e depois da falha, classificados como Início de falha (exclusivo) e Final de falha (exclusivo). Por exemplo, os números de cheque 12345 e 12350 identificariam uma falha com quatro itens ausentes entre estes dois números.

Listar itens ausentes

Esta opção lista os itens individuais ausentes em uma falha. Por exemplo, os números de cheque 12346, 12347, 12348 e 12349.

Estes itens ausentes são valores calculados e, na verdade, não aparecem nos dados sendo testados. Ao usar esta opção, o campo Máximo de itens ausentes permite que você especifique o número máximo de itens ausentes a serem listados individualmente para cada falha, o que é útil quando uma falha é grande. Se o máximo for excedido, o Analytics usará, em vez disso, o método de faixa para a identificação das falhas, com a única diferença que os valores que identificam os pontos de partida e final da falha são o primeiro e o último item ausente – classificados como Início de falha (inclusive) e Final de falha (inclusive).

Nota

O número que você especificar em Máximo de itens ausentes será aplicado para cada falha. Ele não limita o número total dos resultados de itens ausentes em um conjunto de dados, sejam listados individualmente ou por faixa.

Ao utilizar o método de itens ausentes, os resultados poderão conter uma mistura de itens ausentes individuais e de faixas, dependendo do valor definido no campo Máximo de itens ausentes e do tamanho das diferentes falhas.

Testando dados numéricos em falhas

Quando você testa se dados numéricos contêm falhas, o número de casas decimais nos dados estipula o intervalo permitido nos dados:

  • dados numéricos contêm apenas inteiros (sem a parte decimal) o intervalo permitido é 1

    Um intervalo maior do que 1 é uma falha. Para falhas apresentadas como faixas, o número de itens ausentes é o número de números inteiros ausentes.

  • dados numéricos contêm casas decimais o intervalo permitido é equivalente ao menor intervalo decimal

    Por exemplo, se um campo numérico tiver duas casas decimais, o intervalo permitido será 0,01. Um intervalo maior do que o menor intervalo decimal é uma falha. Para falhas apresentadas como faixas, o número de itens ausentes é o número de intervalos decimais ausentes.

Exemplos de teste de falhas em de dados numéricos

No primeiro exemplo, os dados numéricos contêm apenas inteiros. O intervalo permitido é 1.

Valores de teste

Itens ausentes

Número de itens ausentes

-2

-1

0

1

4

5

15

2

3

6 (a) 14 (inclusive)

1 (inteiro)

1 (inteiro)

9 (inteiros)

No segundo exemplo, os dados numéricos contêm duas casas decimais. O intervalo permitido é 0,01.

Valores de teste

Itens ausentes

Número de itens ausentes

4,24

4,25

4,26

4,29

4,30

5,00

4,27

4,28

4,31 (a) 4,99 (inclusive)

1 (intervalo de 0,01)

1 (intervalo de 0,01)

69 (intervalos de 0,01)

Testando falhas nos dados de datahora

Você pode testar dados de data, datahora, ou hora em busca de falhas:

  • O intervalo permitido em campos de data é de um dia

    Um intervalo maior do que um dia será uma falha. Para falhas apresentadas como faixas, o número de itens ausentes é o número de dias ausentes.

  • O intervalo permitido em campos de datahora ou hora é um segundo

    Um intervalo maior do que um segundo é uma falha. Para falhas apresentadas como faixas, o número de itens ausentes é o número de segundos ausentes. Portanto, uma falha de uma hora será apresentada como uma faixa com 3.600 itens ausentes, e uma falha de um dia será apresentada como uma faixa de 86.400 itens ausentes.

Exemplo de teste de falhas em datas e datahoras

No primeiro exemplo, os dados contêm apenas datas. O intervalo permitido é um dia.

Valores de teste

Itens ausentes

Número de itens ausentes

27 Dez 2014

28 Dez 2014

31 Dez 2014

01 Jan 2015

02 Jan 2015

12 Jan 2015

13 Jan 2015

29 Dez 2014

30 Dez 2014

03 Jan 2015 (a) 11 Jan 2015 (inclusive)

1 (dia)

1 (dia)

9 (dias)

No segundo exemplo, os dados contêm datahoras. O intervalo permitido é um segundo.

Valores de teste

Itens ausentes

Número de itens ausentes

31 Dez 2014 23:59:54

31 Dez 2014 23:59:55

31 Dez 2014 23:59:58

31 Dez 2014 23:59:59

01 Jan 2015 01:00:00

01 Jan 2015 01:00:01

02 Jan 2015 01:00:02

31 Dez 2014 23:59:56

31 Dez 2014 23:59:57

01 Jan 2015 00:00:00 (a) 01 Jan 2015 00:59:59 (inclusive)

01 Jan 2015 01:00:02 (a) 02 Jan 2015 01:00:01 (inclusive)

1 (segundo)

1 (segundo)

3.600 (segundos)

86.400 (segundos)

Testando dados numéricos em falhas de um campo de caracteres

Você pode testar se há falhas em dados numéricos que aparecem no campo de caracteres – por exemplo, números de cheques, que normalmente são formatados como dados de caracteres.

Se letras e números aparecerem juntos em um campo de caracteres, apenas os números serão testados e as letras serão ignoradas.

Exemplos de testes de falha em números em um campo de caracteres.

Observe como os prefixos alfabéticos são ignorados e somente os números são considerados.

Valores de teste

Itens ausentes

Número de itens ausentes

A123

C124

 

0 (caractere numérico)

A123

B125

124

1 (caractere numérico)

A ordenação de campos de caracteres pode afetar o teste de falhas

Dependendo da disposição de letras e números nos valores dos campos de caracteres, anomalias podem ocorrer entre os resultados dos testes de falhas. Por exemplo, se alguns números forem precedidos por uma letra e outros não, ou se, na edição não Unicode do Analytics, algumas letras precedentes estiverem em minúsculo e outras em maiúsculo, os resultados podem não ser precisos.

A razão da imprecisão é que a presença inconsistente de caracteres alfabéticos, ou a capitalização incorreta dos caracteres alfabéticos, impede que os números sejam totalmente ordenados de maneira sequencial pela opção Pré-organizar. Na tabela abaixo, 126, 127 e 124 não são na verdade itens ausentes, mas devido à forma como as cadeias alfanuméricas estão ordenadas, eles são apresentados como itens ausentes.

Se você suspeitar da presença de qualquer anomalia, execute uma operação de ordenação separada no campo em questão para revelar a sequência dos valores do campo de caracteres que estão sendo testados em busca de falhas. Se uma ordem numérica sequencial estiver sendo interrompida pela presença de letras, você pode garantir resultados válidos usando uma função do Analytics, como INCLUDE( ), para extrair as letras antes de testar se há falhas.

Exemplos de resultados de falhas incorretos.

Note como a presença inconsistente de caracteres alfabéticos, ou a capitalização inconsistente dos caracteres alfabéticos, faz com que os números sejam relatados incorretamente como faltantes.

Valores de teste

Itens ausentes

Número de itens ausentes

123

124

125

128

129

A-126

A-127

126

127

1 (caractere numérico)

1 (caractere numérico)

A-123

a-124

A-125

A-128

A-129

A-126

A-127

124

1 (caractere numérico)

Etapas

Você pode testar um único campo por vez na tabela ativa para detectar se os números ou valores de datahora em sequência ordenada contêm alguma falha.