Commande CVSPREPARE

Stratifie une population et calcule une taille d'échantillon statistiquement valide pour chaque couche dans le cas de l'échantillonnage de variables classiques.

Syntaxe

CVSPREPARE ON champ_valeur_comptable NUMSTRATA nombre MINIMUM taille_échantillon_couches_minimale PRECISION valeur CONFIDENCE niveau_confiance <CUTOFF valeur> <BCUTOFF valeur> NCELLS nombre PLIMIT {BOTH|UPPER|LOWER} ERRORLIMIT nombre <IF test> <MINSAMPSIZE taille_échantillon_minimale> TO {SCREEN|nom_fichier}

Paramètres

Remarque

N'incluez pas les séparateurs des milliers ou les symboles de pourcentage lorsque vous saisissez des valeurs.

Nom Description
ON valeur_champ_comptable Champ valeur comptable numérique à utiliser pour préparer l'échantillonnage de variables classiques.
NUMSTRATA nombre

Nombre de couches à utiliser pour stratifier numériquement le champ_valeur_comptable.

Le nombre minimal de couches est 1 et le nombre maximal est 256.

Si vous indiquez NUMSTRATA 1 mais pas de CUTOFF, la population reste non stratifiée avant l'extraction d'un échantillon.

Remarque

Le nombre de couches ne peut pas dépasser 50 % du nombre de cellules spécifiées pour NCELLS.

MINIMUM taille_échantillon_couches_minimale

Nombre minimum d'enregistrements à échantillonner dans chaque couche.

Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum.

PRECISION valeur

Le montant monétaire qui est la différence entre l'anomalie acceptable et l'anomalie probable dans le compte.

  • Anomalie acceptable le montant total maximal de l'anomalie que peut présenter le champ de l'échantillon sans que cela soit considéré comme étant une anomalie significative
  • Anomalie probable le montant total de l'anomalie que vous prévoyez de voir contenir le champ de l'échantillon

La précision définit la plage d'acceptabilité pour qu'un compte soit considéré comme évalué justement.

Réduire la précision diminue la plage d'acceptabilité (la marge d'erreur) nécessitant une plus grande taille d'échantillon.

CONFIDENCE niveau_confiance

Le niveau de confiance que vous souhaitez attribuer au fait que l'échantillon créé est représentatif de la population totale.

Par exemple, saisir 95 signifie que vous souhaitez être sûr 95 % du temps que l'échantillon sera bien représentatif. La confiance est le complément du « risque d'échantillonnage ». Un niveau de confiance de 95 % équivaut à un risque d'échantillonnage de 5 %.

  • Si PLIMIT est BOTH, le niveau de confiance minimum est de 10 % et le niveau de confiance maximum est de 99,5 %.
  • Si PLIMIT est UPPER ou LOWER, le niveau de confiance minimum est de 55 % et le niveau de confiance maximum est de 99,5 %.
CUTOFF valeur

optionnel

Valeur limite de couche de certitude supérieure.

Les montants dans champ_valeur_comptable qui sont supérieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon.

Si vous ignorez CUTOFF, une valeur limite par défaut égale au montant maximum dans le champ_valeur_comptable est utilisée et aucun enregistrement n'est inclus dans la couche de certitude supérieure.

BCUTOFF valeur

optionnel

Valeur limite de couche de certitude inférieure.

Les montants dans champ_valeur_comptable qui sont inférieurs ou égaux à la valeur limite sont sélectionnés et inclus automatiquement dans l'échantillon.

Si vous ignorez BCUTOFF, une valeur limite par défaut égale au montant minimum dans le champ_valeur_comptable est utilisée et aucun enregistrement n'est inclus dans la couche de certitude inférieure.

NCELLS nombre

Nombre de cellules à utiliser pour pré-stratifier le champ_valeur_comptable.

Les cellules sont des divisions numériques plus étroites que les couches. La pré-stratification fait partie d'un processus interne optimisant la position des limites des couches. Les cellules ne sont pas conservées dans la sortie stratifiée définitive.

Le nombre minimal de cellules est 2 et le nombre maximal est 999.

Remarque

Le nombre de cellules doit être au moins le double (2 x) du nombre de couches indiqué pour NUMSTRATA.

PLIMIT BOTH | UPPER | LOWER

Type de limite de précision à utiliser.

  • BOTH : spécifiez cette option si :
    • le compte dans son ensemble peut être surestimé ou sous-estimé
    • vous êtes intéressé pour estimer si l'anomalie dans un des deux sens dépasse la PRECISION indiquée
  • UPPER : spécifiez cette option si :
    • le compte dans son ensemble est susceptible d'être sous-estimé
    • vous êtes intéressé pour estimer si le montant total de la sous-évaluation dépasse la PRECISION indiquée
  • LOWER : spécifiez cette option si :
    • le compte dans son ensemble est susceptible d'être surestimé
    • vous êtes intéressé pour estimer si le montant total de la surévaluation dépasse la PRECISION indiquée

    Attention

    Indiquez BOTH si vous ne savez pas quelle option indiquer.

ERRORLIMIT nombre

Nombre minimal d'erreurs que vous prévoyez dans l'échantillon.

Remarque

Si le nombre réel d'erreurs que vous trouvez lorsque vous analysez l'échantillon est inférieur au nombre ERRORLIMIT, la seule méthode d'évaluation possible est la moyenne unitaire.

IF test

optionnel

Expression conditionnelle qui doit être vraie afin de traiter chaque enregistrement. La commande est exécutée uniquement sur les enregistrements remplissant la condition.

Attention

Si vous indiquez une expression conditionnelle, une expression conditionnelle identique doit être utilisée lors du calcul de la taille de l'échantillon et lors de l'extraction de l'échantillon.

Si vous utilisez une condition à un stade et non l'autre, ou si les deux conditions ne sont pas identiques, les résultats de l'échantillonnage ne seront probablement pas statistiquement valides.

MINSAMPSIZE taille_échantillon_minimum

optionnel

Nombre minimum d'enregistrements à échantillonner dans l'intégralité de la population.

Laissez la valeur de zéro (0) par défaut si vous n'avez aucune raison particulière de préciser un nombre minimum.

TO SCREEN | nom_fichier

Emplacement vers lequel envoyer les résultats de la commande :

  • SCREEN : affiche les résultats dans la zone d'affichage d'Analytics

    Astuce

    Vous pouvez cliquer sur n'importe quelle valeur de résultat liée dans la zone d'affichage pour explorer jusqu'à l'enregistrement ou aux enregistrements associés dans la table source.

  • nom_fichier enregistre les résultats dans un fichier

    Indiquez nom_fichier sous forme de chaîne entre guillemets avec l'extension de fichier appropriée. Par exemple : TO "Sortie.TXT"

    Par défaut, le fichier est enregistré dans le dossier contenant le projet Analytics.

    Utilisez un chemin de fichier absolu ou relatif pour enregistrer le fichier dans un autre dossier existant :

    • TO "C:\Sortie.TXT"
    • TO "Résultats\Sortie.TXT"

Variables de sortie Analytics

Nom Contient
CONFIDENCE Niveau de confiance indiqué par l'utilisateur.
ERRLIMIT Nombre minimum d'erreurs spécifié par l'utilisateur.
NSTRATA Nombre de couches spécifié par l'utilisateur.
PLIMIT Type de limite de précision spécifiée par l'utilisateur.
S_IF Expression conditionnelle spécifiée par l'utilisateur
S_TOP Valeur de la limite de la couche de certitude supérieure spécifiée par l'utilisateur ; si aucune valeur n'a été indiquée, il s'agit de la limite supérieure de la couche supérieure calculée par la commande.
SAMPLEFIELD Champ de valeur comptable spécifié par l'utilisateur.
SBOTTOM Valeur de la limite de la couche de certitude inférieure spécifiée par l'utilisateur ; si aucune valeur n'a été indiquée, il s'agit de la limite inférieure de la couche inférieure calculée par la commande.
SBOUNDARY Toutes les limites supérieures des couches calculées par la commande. Ne comprend pas les couches de certitude supérieure ou inférieure.
SPOPULATION Le compte du nombre d'enregistrements dans chaque couche et la valeur monétaire totale de chaque couche. Ne comprend pas les couches de certitude supérieure ou inférieure.
SSAMPLE Taille d'échantillon de chaque couche calculée par la commande. Ne comprend pas les couches de certitude supérieure ou inférieure.

Exemples

Préparer un échantillon de variables classiques

Vous avez décidé d'utiliser un échantillonnage de variables classiques pour estimer le montant total d'anomalie monétaire dans un compte contenant des factures.

Avant d'extraire l'échantillon, vous devez d'abord stratifier la population et calculer une taille d'échantillon statistiquement valide pour chaque couche.

Vous souhaitez être sûr 95 % du temps que l'échantillon extrait par Analytics sera bien représentatif de l'ensemble de la population.

À l'aide du niveau de confiance que vous avez spécifié, l'exemple ci-dessous stratifie une table à partir du champ Montant_Facture et calcule la taille d'échantillon correspondant à chaque couche et à la couche de certitude supérieure :

CVSPREPARE ON Montant_Facture NUMSTRATA 5 MINIMUM 0 PRECISION 928003,97 CONFIDENCE 95,00 CUTOFF 35000 NCELLS 50 PLIMIT BOTH ERRORLIMIT 6 MINSAMPSIZE 0 TO SCREEN

Remarques

Pour plus d'informations sur le fonctionnement de cette commande, consultez Préparer un échantillon de variables classiques.

Limitation de longueur numérique

Plusieurs calculs internes ont eu lieu pendant l'étape de préparation de l'échantillonnage de variables classiques. Ces calculs prennent en charge les nombres d'une longueur maximale de 17 chiffres. Si le résultat d'un calcul dépasse 17 chiffres, ce résultat ne figure pas dans la sortie et vous ne pouvez pas poursuivre le processus d'échantillonnage.

Notez que les nombres des données source d'une longueur inférieure à 17 chiffres peuvent générer des résultats de calculs internes dépassant les 17 chiffres.