Comando SAMPLE

Obtém uma amostra de registros usando o método de amostragem por registro ou de amostragem por unidades monetárias.

Sintaxe

Observação

Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.

Método de seleção de intervalo fixo

SAMPLE <ON> RECORD INTERVAL valor_intervalo <FIXED valor_inicial> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> 

Método de seleção por célula

SAMPLE <ON> RECORD CELL INTERVAL valor_intervalo <RANDOM valor_de_origem> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER> 

Método de seleção aleatório

SAMPLE <ON> RECORD NUMBER tamanho_da_amostra <RANDOM valor_de_origem> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Parâmetros

Observação

Não inclua separadores de milhares ao especificar valores.

Nome Descrição
ON RECORD Use amostragem por registro.
INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra

INTERVAL valor_intervalo FIXED valor_inicial

Use o método de seleção de intervalo fixo.

Um registro inicial é selecionado e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 20º registro após a seleção inicial.

  • INTERVAL valor_intervaloespecifique o valor do intervalo gerado ao calcular o tamanho da amostra.
  • FIXED valor_inicialespecifica o número de registo inicial selecionado

    Se você especificar um valor_inicial de zero ("0") ou omitir FIXED, o Analytics selecionará aleatoriamente o valor de origem.

CELL INTERVAL valor_intervalo

Use o método de seleção por célula.

O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e um registro é selecionado aleatoriamente em cada célula.

O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra.

NUMBER tamanho_da_amostra

Use o método de seleção aleatória.

Todos os registros são selecionados aleatoriamente em todo o conjunto de dados.

Especifique o tamanho da amostra gerado ao calcular o tamanho da amostra.

RANDOM valor_de_origem

opcional

Observação

Somente para métodos de seleção por célula e aleatório.

O valor de origem usado para inicializar o gerador de números aleatórios no Analytics.

Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem.

ORDER

opcional

Observação

Somente para o método de seleção aleatório.

Use ORDER apenas quando especificar FIELDS.

Adiciona o campo ORDER aos resultados de saída.

Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente.

RECORD | FIELDS nome_campo <...n> | FIELDS ALL
  • RECORDtodo o registro é incluído na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela.

  • FIELDS nome_campocampos individuais, em vez de todo o registo, são incluídos na tabela de saída

    Especifique o(s) campo(s) ou expressões a incluir. Se você especificar vários campos, eles devem ser separados por espaços.

    Os campos são incluídos na ordem em que são listados.

  • FIELDS ALLtodos os campos selecionados serão incluídos na tabela de saída.

    Os campos são incluídos na ordem em que aparecem no layout da tabela.

EXCLUDE nome_campo

opcional

Válido apenas ao amostrar usando FIELDS ALL.

O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados.

EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo:

FIELDS ALL EXCLUDE campo_1 campo_2
FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2 
TO nome_tabela

A localização para onde enviar os resultados do comando:

  • nome_tabelasalva os resultados em uma tabela do Analytics

    Especifique nome_tabela como uma cadeia entre aspas com uma extensão de arquivo .FIL. Por exemplo: TO "Output.FIL"

    Por padrão, o arquivo de dados da tabela (.FIL) é salvo na pasta que contém o projeto do Analytics.

    Use um caminho de arquivo absoluto ou relativo para salvar o arquivo de dados em uma pasta diferente já existente:

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    Observação

    Os nomes de tabela são limitados a 64 caracteres alfanuméricos, sem contar a extensão .FIL. O nome pode incluir o caractere de sublinhado ( _ ) mas nenhum outro caractere especial e nenhum espaço. O nome não pode começar com um número.

LOCAL

opcional

Salva o arquivo de saída no mesmo local que o projeto do Analytics.

Observação

Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics.

O parâmetro LOCAL deve seguir imediatamente o parâmetro TO.

OPEN

opcional

Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída.

APPEND

opcional

Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo.

Observação

Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:

  • os mesmos campos
  • a mesma ordem de campos
  • os campos correspondentes têm o mesmo comprimento
  • os campos correspondentes têm o mesmo tipo de dados

O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos.

MERSENNE_TWISTER

opcional

Observação

Somente para métodos de seleção por célula e aleatório.

O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister.

Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics.

Observação

Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12.

Exemplos

Obter uma amostra de registros

Você vai usar amostragem por registro para estimar a taxa de desvio de um controle prescrito em uma conta que contém faturas.

Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção aleatória.

O exemplos abaixo:

  • Amostra a tabela aberta do
  • Usa o método de seleção aleatória com um valor de origem de 123456
  • Especifica um tamanho de amostra de 95 registros
  • Inclui somente os campos especificados na tabela de saída
  • Especifica que o gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS NumRef NumCliente Valor Data Tipo TO "Amostra_registro_Cr" OPEN MERSENNE_TWISTER

Observações

Para obter mais informações sobre o funcionamento desse comando, consulte Execução da amostragem por registro.

Sintaxe

Observação

Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.

Método de seleção de intervalo fixo

SAMPLE <ON> campo_numérico_de_aum INTERVAL valor_do_intervalo <FIXED valor_inicial> <CUTOFF valor_limite_estrato_superior> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campoe <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> 

Método de seleção por célula

SAMPLE <ON> campo_numérico_de_aum CELL INTERVAL valor_intervalo <CUTOFF valor_limite_estrato_superior> <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER> 

Método de seleção aleatório

SAMPLE <ON> campo_numérico_de_aum NUMBER tamanho_da_amostra POPULATION valor_absoluto <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

Parâmetros

Observação

Não inclua separadores de milhares ao especificar valores.

Nome Descrição
ON campo_numérico_de_aum

Use amostragem por unidades monetárias (AUM).

campo_numérico_de_aum é o campo ou expressão numérica a ser usada como base da amostragem.

INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra POPULATION valor_absoluto

INTERVAL valor_intervalo FIXED valor_inicial

Use o método de seleção de intervalo fixo.

Uma unidade monetária inicial é selecionada e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 5.000ª unidade monetária após a seleção inicial.

  • INTERVAL valor_intervaloespecifique o valor do intervalo gerado ao calcular o tamanho da amostra.
  • FIXED valor_inicialespecifica a unidade monetária inicial selecionado

    Se você especificar um valor_inicial de zero ("0") ou omitir FIXED, o Analytics selecionará a unidade monetária individual.

CELL INTERVAL valor_intervalo

Use o método de seleção por célula.

O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e uma unidade monetária é selecionada aleatoriamente em cada célula.

O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra.

NUMBER tamamanho_amostra POPULATION valor_absoluto

Use o método de seleção aleatória.

Todas as unidades monetárias são selecionadas aleatoriamente em todo o conjunto de dados.

  • NUMBER tamanho_da_amostraespecifique o tamanho da amostra gerado ao calcular o tamanho da amostra
  • POPULATION valor_absolutoespecifique o valor total absoluto de campo_numérico_de_aum, que é a população onde a amostra será selecionada
CUTOFF valor_limite_estrato_superior

opcional

Observação

Somente para métodos de seleção por intervalo fixo ou por célula.

Um valor de limite do estrato superior.

Valores de campo_numérico_de_aum maiores ou iguais ao valor do limite serão selecionados e incluídos automaticamente na amostra.

Se você omitir CUTOFF, será usado um valor limite padrão igual ao valor_intervalo.

RANDOM valor_de_origem

opcional

Observação

Somente para métodos de seleção por célula e aleatório.

O valor de origem usado para inicializar o gerador de números aleatórios no Analytics.

Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem.

SUBSAMPLE

opcional

Observação

Use SUBSAMPLE apenas quando especificar FIELDS.

Adiciona o campo SUBSAMPLE aos resultados de saída.

Se cada valor em um campo de amostragem representar um total de várias transações separadas e você quiser executar procedimentos de auditoria em apenas uma transação de cada valor total amostrado, será possível usar os valores do campo SUBSAMPLE para selecionar aleatoriamente as transações individuais.

Para obter mais informações, consulte Execução da amostragem por unidades monetárias.

NOREPLACEMENT

opcional

O mesmo registro não é selecionado mais de uma vez. Como resultado, a amostra pode conter menos registros que a quantidade calculada pelo comando SIZE.

Se NOREPLACEMENT for omitido, ou se você especificar REPLACEMENT, os registros poderão ser selecionados mais de uma vez.

ORDER

opcional

Observação

Somente para o método de seleção aleatório.

Use ORDER apenas quando especificar FIELDS.

Adiciona o campo ORDER aos resultados de saída.

Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente.

RECORD | FIELDS nome_campo <...n> | FIELDS ALL
  • RECORDtodo o registro é incluído na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela.

  • FIELDS nome_campocampos individuais, em vez de todo o registo, são incluídos na tabela de saída

    Especifique o(s) campo(s) ou expressões a incluir. Se você especificar vários campos, eles devem ser separados por espaços.

    Os campos são incluídos na ordem em que são listados.

  • FIELDS ALLtodos os campos selecionados serão incluídos na tabela de saída

    Os campos são incluídos na ordem em que aparecem no layout da tabela.

EXCLUDE nome_campo

opcional

Válido apenas ao amostrar usando FIELDS ALL.

O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados.

EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo:

FIELDS ALL EXCLUDE campo_1 campo_2
FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2 
TO nome_tabela

A localização para onde enviar os resultados do comando:

  • nome_tabelasalva os resultados em uma tabela do Analytics

    Especifique nome_tabela como uma cadeia entre aspas com uma extensão de arquivo .FIL. Por exemplo: TO "Output.FIL"

    Por padrão, o arquivo de dados da tabela (.FIL) é salvo na pasta que contém o projeto do Analytics.

    Use um caminho de arquivo absoluto ou relativo para salvar o arquivo de dados em uma pasta diferente já existente:

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    Observação

    Os nomes de tabela são limitados a 64 caracteres alfanuméricos, sem contar a extensão .FIL. O nome pode incluir o caractere de sublinhado ( _ ) mas nenhum outro caractere especial e nenhum espaço. O nome não pode começar com um número.

LOCAL

opcional

Salva o arquivo de saída no mesmo local que o projeto do Analytics.

Observação

Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics.

O parâmetro LOCAL deve seguir imediatamente o parâmetro TO.

OPEN

opcional

Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída.

APPEND

opcional

Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo.

Observação

Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:

  • os mesmos campos
  • a mesma ordem de campos
  • os campos correspondentes têm o mesmo comprimento
  • os campos correspondentes têm o mesmo tipo de dados

O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos.

MERSENNE_TWISTER

opcional

Observação

Somente para métodos de seleção por célula e aleatório.

O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister.

Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics.

Observação

Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12.

Exemplos

Obter uma amostragem por unidades monetárias

Use a amostragem por unidades monetárias para estimar o valor total de afirmações incorretas monetárias em uma conta que contém faturas.

Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção de intervalo fixo.

O exemplos abaixo:

  • Amostra a tabela aberta do Analytics com base em um campo de valor da transação
  • Usa o método de seleção de intervalo fixo com um valor de intervalo de US$ 6.283,33
  • Especifica que o primeiro registro selecionado contém a 100.000ª unidade monetária (o número de centavos em US$ 1.000)
  • Usa um limite do estrato superior de US$ 5.000
  • Inclui todo o registro na tabela de saída
SAMPLE ON Valor INTERVAL 6283,33 FIXED 1000,00 CUTOFF 5000,00 RECORD TO "Amostra_unidade_monetária_Cr" OPEN

Observações

Para obter mais informações sobre como este comando funciona, consulte Execução da amostragem por unidades monetárias.