Comando SAMPLE

Obtém uma amostra de registros usando o método de amostragem por registro ou de amostragem por unidades monetárias.

Sintaxe

Nota

Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.

Método de seleção de intervalo fixo

SAMPLE <ON> RECORD INTERVAL valor_intervalo <FIXED valor_inicial> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND>

Método de seleção por célula

SAMPLE <ON> RECORD CELL INTERVAL valor_intervalo <RANDOM valor_de_origem> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Método de seleção aleatório

SAMPLE <ON> RECORD NUMBER tamanho_da_amostra <RANDOM valor_de_origem> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Parâmetros

Nota

Não inclua separadores de milhares ao especificar valores.

Nome Descrição
ON RECORD Use amostragem por registro.
INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra

INTERVAL valor_intervalo FIXED valor_inicial

Use o método de seleção de intervalo fixo.

Um registro inicial é selecionado e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 20º registro após a seleção inicial.

  • INTERVAL valor_intervalo especifique o valor do intervalo gerado ao calcular o tamanho da amostra
  • FIXED valor_inicial especifique o número do registro inicial selecionado

    Se você especificar valor_inicial como zero ("0") ou omitir FIXED, o Analytics selecionará aleatoriamente o registro inicial.

CELL INTERVAL valor_intervalo

Use o método de seleção por célula.

O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e um registro é selecionado aleatoriamente em cada célula.

O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra.

NUMBER tamanho_da_amostra

Use o método de seleção aleatória.

Todos os registros são selecionados aleatoriamente em todo o conjunto de dados.

Especifique o tamanho da amostra gerado ao calcular o tamanho da amostra.

RANDOM valor_de_origem

opcional

Nota

Somente para métodos de seleção por célula e aleatório.

O valor de origem usado para inicializar o gerador de números aleatórios no Analytics.

Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem.

ORDER

opcional

Nota

Somente para o método de seleção aleatório.

Use ORDER apenas quando especificar FIELDS.

Adiciona o campo ORDER aos resultados de saída.

Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente.

RECORD | FIELDS nome_campo <...n> | FIELDS ALL
  • RECORD o registro inteiro é incluído na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela de origem.

  • FIELDS nome_campo campos individuais, em vez do registro inteiro, serão incluídos na tabela de saída

    Especifique os campos ou expressões a serem incluídos. Se você especificar vários campos, eles devem ser separados por espaços.

    Os campos são incluídos na ordem em que são listados.

  • FIELDS ALL todos os campos são incluídos na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela de origem.

EXCLUDE nome_campo

opcional

Válido apenas ao amostrar usando FIELDS ALL.

O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados.

EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo:

FIELDS ALL EXCLUDE campo_1 campo_2
FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2
TO nome_tabela

A localização para onde enviar os resultados do comando:

  • nome_tabela salva os resultados em uma tabela do Analytics

    Especifique nome_tabela como uma cadeia entre aspas com uma extensão de arquivo .FIL. For exemplo: TO "Saída.FIL"

    Por padrão, o arquivo de dados da tabela (.fil) é salvo na pasta que contém o projeto do Analytics.

    Use um caminho de arquivo absoluto ou relativo para salvar o arquivo de dados em uma pasta diferente já existente:

    • TO "C:\Saída.FIL"
    • TO "Resultados\Saída.FIL"

    Nota

    Os nomes de tabela são limitados a 64 caracteres alfanuméricos, sem contar a extensão .FIL. O nome pode incluir o caractere de sublinhado ( _ ) mas nenhum outro caractere especial e nenhum espaço. O nome não pode começar com um número.

LOCAL

opcional

Salva o arquivo de saída no mesmo local que o projeto do Analytics.

Nota

Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics.

O parâmetro LOCAL deve seguir imediatamente o parâmetro TO.

OPEN

opcional

Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída.

APPEND

opcional

Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo.

Nota

Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:

  • os mesmos campos
  • a mesma ordem de campos
  • os campos correspondentes têm o mesmo comprimento
  • os campos correspondentes têm o mesmo tipo de dados

O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos.

MERSENNE_TWISTER

opcional

Nota

Somente para métodos de seleção por célula e aleatório.

O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister.

Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics.

Nota

Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12.

Exemplos

Obter uma amostra de registros

Você vai usar amostragem por registro para estimar a taxa de desvio de um controle prescrito em uma conta que contém faturas.

Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção aleatória.

O exemplos abaixo:

  • Amostra a tabela aberta do Analytics
  • Usa o método de seleção aleatória com um valor de origem de 123456
  • Especifica um tamanho de amostra de 95 registros
  • Inclui somente os campos especificados na tabela de saída
  • Especifica que o gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS NumRef NumCliente Valor Data Tipo TO "Amostra_registro_Cr" OPEN MERSENNE_TWISTER

Observações

Para obter mais informações sobre o funcionamento desse comando, consulte Execução da amostragem por registro.

Sintaxe

Nota

Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.

Método de seleção de intervalo fixo

SAMPLE <ON> campo_numérico_de_aum INTERVAL valor_do_intervalo <FIXED valor_inicial> <CUTOFF valor_limite_estrato_superior> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campoe <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND>

Método de seleção por célula

SAMPLE <ON> campo_numérico_de_aum CELL INTERVAL valor_intervalo <CUTOFF valor_limite_estrato_superior> <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Método de seleção aleatório

SAMPLE <ON> campo_numérico_de_aum NUMBER tamanho_da_amostra POPULATION valor_absoluto <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Parâmetros

Nota

Não inclua separadores de milhares ao especificar valores.

Nome Descrição
ON campo_numérico_de_aum

Use amostragem por unidades monetárias (AUM).

campo_numérico_de_aum é o campo ou expressão numérica a ser usada como base da amostragem.

INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra POPULATION valor_absoluto

INTERVAL valor_intervalo FIXED valor_inicial

Use o método de seleção de intervalo fixo.

Uma unidade monetária inicial é selecionada e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 5.000ª unidade monetária após a seleção inicial.

  • INTERVAL valor_intervalo especifique o valor do intervalo gerado ao calcular o tamanho da amostra
  • FIXED valor_inicial especifique o número da unidade monetária inicial selecionada

    Se você especificar valor_inicial como zero ("0") ou omitir FIXED, o Analytics selecionará aleatoriamente a unidade monetária inicial.

CELL INTERVAL valor_intervalo

Use o método de seleção por célula.

O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e uma unidade monetária é selecionada aleatoriamente em cada célula.

O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra.

NUMBER tamamanho_amostra POPULATION valor_absoluto

Use o método de seleção aleatória.

Todas as unidades monetárias são selecionadas aleatoriamente em todo o conjunto de dados.

  • NUMBER tamanho_amostra especifique o tamanho da amostra gerado ao calcular o tamanho da amostra
  • POPULATION valor_absoluto especifique o valor total absoluto de campo_numérico_de_aum, que é a população onde a amostra será selecionada
CUTOFF valor_limite_estrato_superior

opcional

Nota

Somente para métodos de seleção por intervalo fixo ou por célula.

Um valor de limite do estrato superior.

Valores de campo_numérico_de_aum maiores ou iguais ao valor do limite serão selecionados e incluídos automaticamente na amostra.

Se você omitir CUTOFF, será usado um valor limite padrão igual ao valor_intervalo.

RANDOM valor_de_origem

opcional

Nota

Somente para métodos de seleção por célula e aleatório.

O valor de origem usado para inicializar o gerador de números aleatórios no Analytics.

Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem.

SUBSAMPLE

opcional

Nota

Use SUBSAMPLE apenas quando especificar FIELDS.

Adiciona o campo SUBSAMPLE aos resultados de saída.

Se cada valor em um campo de amostragem representar um total de várias transações separadas e você quiser executar procedimentos de auditoria em apenas uma transação de cada valor total amostrado, será possível usar os valores do campo SUBSAMPLE para selecionar aleatoriamente as transações individuais.

Para obter mais informações, consulte Execução da amostragem por unidades monetárias.

NOREPLACEMENT

opcional

O mesmo registro não é selecionado mais de uma vez. Como resultado, a amostra pode conter menos registros que a quantidade calculada pelo comando SIZE.

Se NOREPLACEMENT for omitido, ou se você especificar REPLACEMENT, os registros poderão ser selecionados mais de uma vez.

ORDER

opcional

Nota

Somente para o método de seleção aleatório.

Use ORDER apenas quando especificar FIELDS.

Adiciona o campo ORDER aos resultados de saída.

Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente.

RECORD | FIELDS nome_campo <...n> | FIELDS ALL
  • RECORD o registro inteiro é incluído na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela de origem.

  • FIELDS nome_campo campos individuais, em vez do registro inteiro, serão incluídos na tabela de saída

    Especifique os campos ou expressões a serem incluídos. Se você especificar vários campos, eles devem ser separados por espaços.

    Os campos são incluídos na ordem em que são listados.

  • FIELDS ALL todos os campos são incluídos na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela de origem.

EXCLUDE nome_campo

opcional

Válido apenas ao amostrar usando FIELDS ALL.

O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados.

EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo:

FIELDS ALL EXCLUDE campo_1 campo_2
FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2
TO nome_tabela

A localização para onde enviar os resultados do comando:

  • nome_tabela salva os resultados em uma tabela do Analytics

    Especifique nome_tabela como uma cadeia entre aspas com uma extensão de arquivo .FIL. For exemplo: TO "Saída.FIL"

    Por padrão, o arquivo de dados da tabela (.fil) é salvo na pasta que contém o projeto do Analytics.

    Use um caminho de arquivo absoluto ou relativo para salvar o arquivo de dados em uma pasta diferente já existente:

    • TO "C:\Saída.FIL"
    • TO "Resultados\Saída.FIL"

    Nota

    Os nomes de tabela são limitados a 64 caracteres alfanuméricos, sem contar a extensão .FIL. O nome pode incluir o caractere de sublinhado ( _ ) mas nenhum outro caractere especial e nenhum espaço. O nome não pode começar com um número.

LOCAL

opcional

Salva o arquivo de saída no mesmo local que o projeto do Analytics.

Nota

Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics.

O parâmetro LOCAL deve seguir imediatamente o parâmetro TO.

OPEN

opcional

Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída.

APPEND

opcional

Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo.

Nota

Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:

  • os mesmos campos
  • a mesma ordem de campos
  • os campos correspondentes têm o mesmo comprimento
  • os campos correspondentes têm o mesmo tipo de dados

O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos.

MERSENNE_TWISTER

opcional

Nota

Somente para métodos de seleção por célula e aleatório.

O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister.

Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics.

Nota

Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12.

Exemplos

Obter uma amostragem por unidades monetárias

Use a amostragem por unidades monetárias para estimar o valor total de afirmações incorretas monetárias em uma conta que contém faturas.

Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção de intervalo fixo.

O exemplos abaixo:

  • Amostra a tabela aberta do Analytics com base em um campo de valor da transação
  • Usa o método de seleção de intervalo fixo com um valor de intervalo de US$ 6.283,33
  • Especifica que o primeiro registro selecionado contém a 100.000ª unidade monetária (o número de centavos em US$ 1.000)
  • Usa um limite do estrato superior de US$ 5.000
  • Inclui todo o registro na tabela de saída
SAMPLE ON Valor INTERVAL 6283,33 FIXED 1000,00 CUTOFF 5000,00 RECORD TO "Amostra_unidade_monetária_Cr" OPEN

Observações

Para obter mais informações sobre o funcionamento desse comando, consulte Execução da amostragem por unidades monetárias.