Comando SAMPLE
Informações do conceito
Execução da amostragem por registro
Obtém uma amostra de registros usando o método de amostragem por registro ou de amostragem por unidades monetárias.
Sintaxe
Nota
Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.
Método de seleção de intervalo fixo
SAMPLE <ON> RECORD INTERVAL valor_intervalo <FIXED valor_inicial> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND>
Método de seleção por célula
SAMPLE <ON> RECORD CELL INTERVAL valor_intervalo <RANDOM valor_de_origem> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
Método de seleção aleatório
SAMPLE <ON> RECORD NUMBER tamanho_da_amostra <RANDOM valor_de_origem> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
Parâmetros
Nota
Não inclua separadores de milhares ao especificar valores.
| Nome | Descrição |
|---|---|
| ON RECORD | Use amostragem por registro. |
| INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra |
INTERVAL valor_intervalo FIXED valor_inicial Use o método de seleção de intervalo fixo. Um registro inicial é selecionado e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 20º registro após a seleção inicial.
CELL INTERVAL valor_intervalo Use o método de seleção por célula. O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e um registro é selecionado aleatoriamente em cada célula. O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra. NUMBER tamanho_da_amostra Use o método de seleção aleatória. Todos os registros são selecionados aleatoriamente em todo o conjunto de dados. Especifique o tamanho da amostra gerado ao calcular o tamanho da amostra. |
| RANDOM valor_de_origem opcional |
Nota Somente para métodos de seleção por célula e aleatório. O valor de origem usado para inicializar o gerador de números aleatórios no Analytics. Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem. |
|
ORDER opcional |
Nota Somente para o método de seleção aleatório. Use ORDER apenas quando especificar FIELDS. Adiciona o campo ORDER aos resultados de saída. Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente. |
| RECORD | FIELDS nome_campo <...n> | FIELDS ALL |
|
| EXCLUDE nome_campo opcional |
Válido apenas ao amostrar usando FIELDS ALL. O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados. EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo: FIELDS ALL EXCLUDE campo_1 campo_2 FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2 |
| TO nome_tabela |
A localização para onde enviar os resultados do comando:
|
|
LOCAL opcional |
Salva o arquivo de saída no mesmo local que o projeto do Analytics. Nota Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics. O parâmetro LOCAL deve seguir imediatamente o parâmetro TO. |
|
OPEN opcional |
Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída. |
|
APPEND opcional |
Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo. Nota Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:
O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos. |
|
MERSENNE_TWISTER opcional |
Nota Somente para métodos de seleção por célula e aleatório. O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister. Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics. Nota Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12. |
Exemplos
Obter uma amostra de registros
Você vai usar amostragem por registro para estimar a taxa de desvio de um controle prescrito em uma conta que contém faturas.
Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção aleatória.
O exemplos abaixo:
- Amostra a tabela aberta do Analytics
- Usa o método de seleção aleatória com um valor de origem de 123456
- Especifica um tamanho de amostra de 95 registros
- Inclui somente os campos especificados na tabela de saída
- Especifica que o gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS NumRef NumCliente Valor Data Tipo TO "Amostra_registro_Cr" OPEN MERSENNE_TWISTER
Observações
Para obter mais informações sobre o funcionamento desse comando, consulte Execução da amostragem por registro.
Sintaxe
Nota
Essa sintaxe não inclui filtros (instruções IF) ou parâmetros de escopo porque a aplicação dessas opções compromete a validade da amostra.
Método de seleção de intervalo fixo
SAMPLE <ON> campo_numérico_de_aum INTERVAL valor_do_intervalo <FIXED valor_inicial> <CUTOFF valor_limite_estrato_superior> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campoe <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND>
Método de seleção por célula
SAMPLE <ON> campo_numérico_de_aum CELL INTERVAL valor_intervalo <CUTOFF valor_limite_estrato_superior> <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
Método de seleção aleatório
SAMPLE <ON> campo_numérico_de_aum NUMBER tamanho_da_amostra POPULATION valor_absoluto <RANDOM valor_de_origem> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS nome_campo <...n>|FIELDS ALL <EXCLUDE nome_campo <...n>>} TO nome_tabela <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
Parâmetros
Nota
Não inclua separadores de milhares ao especificar valores.
| Nome | Descrição |
|---|---|
| ON campo_numérico_de_aum |
Use amostragem por unidades monetárias (AUM). campo_numérico_de_aum é o campo ou expressão numérica a ser usada como base da amostragem. |
| INTERVAL valor_intervalo FIXED valor_inicial | CELL INTERVAL valor_intervalo | NUMBER tamanho_amostra POPULATION valor_absoluto |
INTERVAL valor_intervalo FIXED valor_inicial Use o método de seleção de intervalo fixo. Uma unidade monetária inicial é selecionada e todas as seleções subsequentes estarão em um intervalo fixo ou a uma determinada distância entre si. Por exemplo, cada 5.000ª unidade monetária após a seleção inicial.
CELL INTERVAL valor_intervalo Use o método de seleção por célula. O conjunto de dados é dividido em várias células ou grupos do mesmo tamanho e uma unidade monetária é selecionada aleatoriamente em cada célula. O valor do intervalo determina o tamanho de cada célula. Especifique o valor do intervalo gerado ao calcular o tamanho da amostra. NUMBER tamamanho_amostra POPULATION valor_absoluto Use o método de seleção aleatória. Todas as unidades monetárias são selecionadas aleatoriamente em todo o conjunto de dados.
|
| CUTOFF valor_limite_estrato_superior opcional |
Nota Somente para métodos de seleção por intervalo fixo ou por célula. Um valor de limite do estrato superior. Valores de campo_numérico_de_aum maiores ou iguais ao valor do limite serão selecionados e incluídos automaticamente na amostra. Se você omitir CUTOFF, será usado um valor limite padrão igual ao valor_intervalo. |
| RANDOM valor_de_origem opcional |
Nota Somente para métodos de seleção por célula e aleatório. O valor de origem usado para inicializar o gerador de números aleatórios no Analytics. Se você especificar um valor zero ("0") ou omitir RANDOM, o Analytics selecionará aleatoriamente o valor de origem. |
|
SUBSAMPLE opcional |
Nota Use SUBSAMPLE apenas quando especificar FIELDS. Adiciona o campo SUBSAMPLE aos resultados de saída. Se cada valor em um campo de amostragem representar um total de várias transações separadas e você quiser executar procedimentos de auditoria em apenas uma transação de cada valor total amostrado, será possível usar os valores do campo SUBSAMPLE para selecionar aleatoriamente as transações individuais. Para obter mais informações, consulte Execução da amostragem por unidades monetárias. |
|
NOREPLACEMENT opcional |
O mesmo registro não é selecionado mais de uma vez. Como resultado, a amostra pode conter menos registros que a quantidade calculada pelo comando SIZE. Se NOREPLACEMENT for omitido, ou se você especificar REPLACEMENT, os registros poderão ser selecionados mais de uma vez. |
|
ORDER opcional |
Nota Somente para o método de seleção aleatório. Use ORDER apenas quando especificar FIELDS. Adiciona o campo ORDER aos resultados de saída. Esse campo exibe a ordem em que cada registro é selecionado aleatoriamente. |
| RECORD | FIELDS nome_campo <...n> | FIELDS ALL |
|
| EXCLUDE nome_campo opcional |
Válido apenas ao amostrar usando FIELDS ALL. O campo ou os campos a serem excluídos do comando. EXCLUDE permite ajustar a palavra-chave ALL, excluindo os campos especificados. EXCLUDE deve seguir FIELDS ALL imediatamente ou a última ocorrência da palavra-chave ALL se você estiver incluindo campos de uma ou mais tabelas relacionadas. Por exemplo: FIELDS ALL EXCLUDE campo_1 campo_2 FIELDS ALL nome_tabela_relacionada.ALL EXCLUDE campo_1 campo_2 |
| TO nome_tabela |
A localização para onde enviar os resultados do comando:
|
|
LOCAL opcional |
Salva o arquivo de saída no mesmo local que o projeto do Analytics. Nota Aplicável apenas na execução de um comando em uma tabela de servidor com um campo de saída que é uma tabela do Analytics. O parâmetro LOCAL deve seguir imediatamente o parâmetro TO. |
|
OPEN opcional |
Abre a tabela criada pelo comando após a execução do comando. Válido apenas se o comando criar uma tabela de saída. |
|
APPEND opcional |
Anexa a saída do comando ao final de um arquivo existente, em vez de sobrescrevê-lo. Nota Você deve garantir que a estrutura da saída do comando e o arquivo existente são idênticos:
O Analytics anexa a saída a um arquivo existente, seja qual for sua estrutura. Se a estrutura da saída e do arquivo existente não corresponderem, o resultado poderá ser dados misturados, ausentes ou incorretos. |
|
MERSENNE_TWISTER opcional |
Nota Somente para métodos de seleção por célula e aleatório. O gerador de números aleatórios no Analytics usa o algoritmo Mersenne-Twister. Se você omitir MERSENNE_TWISTER, será usado o algoritmo padrão do Analytics. Nota Use o algoritmo padrão apenas se precisar de compatibilidade retroativa com scripts ou resultados de amostragem do Analytics criados antes do Analytics versão 12. |
Exemplos
Obter uma amostragem por unidades monetárias
Use a amostragem por unidades monetárias para estimar o valor total de afirmações incorretas monetárias em uma conta que contém faturas.
Após calcular um tamanho de amostra estatisticamente válido, você está pronto para obter a amostra. Use o método de seleção de intervalo fixo.
O exemplos abaixo:
- Amostra a tabela aberta do Analytics com base em um campo de valor da transação
- Usa o método de seleção de intervalo fixo com um valor de intervalo de US$ 6.283,33
- Especifica que o primeiro registro selecionado contém a 100.000ª unidade monetária (o número de centavos em US$ 1.000)
- Usa um limite do estrato superior de US$ 5.000
- Inclui todo o registro na tabela de saída
SAMPLE ON Valor INTERVAL 6283,33 FIXED 1000,00 CUTOFF 5000,00 RECORD TO "Amostra_unidade_monetária_Cr" OPEN
Observações
Para obter mais informações sobre o funcionamento desse comando, consulte Execução da amostragem por unidades monetárias.