Stratification des données

Information de concept

Commande STRATIFY

La stratification permet de regrouper les enregistrements dans une table par intervalles numériques (plages de valeurs) à partir des valeurs d'un champ numérique et de compter le nombre d'enregistrements dans chaque intervalle.

Par exemple, vous pourriez effectuer une stratification sur une table Comptes clients sur le champ Montant de la facture pour regrouper les enregistrements par intervalle de 5 000 € – factures comprises entre 0 et 4 999,99 €, factures comprises entre 5 000 € et 9 999 €, etc. – et pour rechercher le nombre total de transactions ainsi que le montant total des transactions pour chaque intervalle.

Sous-totalisation de champs numériques associés

Lorsque vous effectuez une stratification, vous pouvez éventuellement sous-totaliser un ou plusieurs champs numériques associés. Dans l'exemple précédent, vous pouvez sous-totaliser le champ correspondant au montant de la réduction pour rechercher le montant total de la réduction pour chaque intervalle.

Remarque

Si vous ne spécifiez pas de champ de sous-total, le champ par lequel vous effectuez la stratification est automatiquement sous-totalisé.

Fonctionnement des intervalles numériques

Les intervalles numériques sont des plages de valeurs. Deux possibilités s'offrent à vous lorsque vous créez des intervalles numériques :

  • intervalles de taille égale ;
  • intervalles de taille personnalisée.

Intervalles de taille égale

Analytics calcule des intervalles de taille égale en regroupant les valeurs dans le champ clé au sein d'un nombre d'intervalles spécifié.

Pour créer des intervalles de taille égale, vous spécifiez la valeur minimale du premier intervalle et la valeur maximale du dernier intervalle, ainsi que le nombre d'intervalles souhaité.

Astuce

Si vous utilisez les valeurs minimale et maximale réelles dans le champ, la taille de l'intervalle n'est généralement pas un montant rond. Pour que l'intervalle soit un montant rond, vous pouvez spécifier des valeurs minimale et maximale sous forme de montants ronds, par exemple, 0 et 5000.

Intervalles de taille personnalisée

Analytics calcule des intervalles de taille personnalisée en regroupant les valeurs dans le champ clé au sein d'intervalles présentant les valeurs de départ que vous spécifiez.

Pour créer des intervalles de taille personnalisée, indiquez la valeur de départ de chaque intervalle et la valeur de fin du dernier intervalle. Vous pouvez créer des intervalles de taille égale ou des intervalles de tailles différentes.

Exemples d'intervalles de taille égale et de taille personnalisée

Le tableau ci-dessous montre des exemples de types d'intervalles que vous pourriez créer pour un jeu de valeurs allant de 48,19 € à 4 792,83 €.

Intervalles de taille égale

(à l'aide des valeurs réelles min et max)

Intervalles de taille égale

(min et max spécifiés sous forme de chiffres ronds)

Intervalles de taille personnalisée
48,19 - 997,11

997,12 - 1 946,04

1 946,05 - 2 894,97

2 894,98 - 3 843,90

3 843,91 - 4 792,83

0,00 - 999,99

1 000,00 - 1 999,99

2 000,00 - 2 999,99

3 000,00 - 3 999,99

4 000,00 - 5 000,00

0,00 - 99,99

100,00 - 999,99

1 000,00 - 5 000,00

Stratification et tri

Vous pouvez stratifier des tables triées ou non triées. Lorsque vous stratifiez une table non triée, Analytics trie automatiquement les résultats de sortie dans le cadre de l'opération de stratification.

Option Statistiques

L'option Inclure les statistiques pour les champs de sous-total permet de calculer les valeurs moyenne, minimale et maximale pour chaque champ numérique sous-totalisé. Dans l'exemple précédent, l'utilisation de l'option Statistiques calculerait les montants de facture moyen, minimum et maximum pour chaque intervalle ainsi que les montants de réduction moyen, minimum et maximum dans chaque intervalle si vous aviez également sous-totalisé le champ Montant de la réduction.

Stratification en détail

La stratification permet d'effectuer les opérations suivantes :

Opération

Emplacement dans Résultats de stratification

Elle regroupe les enregistrements en intervalles basés sur un champ numérique.

Champ Montant de trans, premier

Elle compte (sous-totalise) le nombre d'enregistrements de chaque intervalle, ainsi que le pourcentage du nombre total représenté par chaque sous-total.

Champ Compte

Champ Pourcentage du compte

Elle fournit les valeurs minimum et maximum dans le champ numérique à stratifier.

non illustré

Elle sous-totalise éventuellement les valeurs d'un ou de plusieurs champs numériques pour chaque intervalle et calcule le pourcentage de la valeur du champ représenté par chaque sous-total pour le premier champ sélectionné.

Champ Montant de trans, second

Champ Champ en pourcentage

Elle calcule éventuellement les valeurs moyenne, minimale et maximale pour chaque champ numérique sous-totalisé

non illustré

Elle indique les totaux de tous les champs numériques inclus dans les résultats de sortie.

Ligne Totaux

Elle ventile éventuellement les résultats de sortie en fonction des valeurs d'un champ caractère, par exemple un champ ID client ou Type de transaction (requiert le tri du champ caractère avant la stratification).

non illustré

Résultats de stratification

Résultats de sortie produits par :

  • stratification en fonction du montant des transactions dans une table Comptes clients

    (la table Ar dans ACL DATA\Exemples de fichiers de données\Exemple de projet.ACL)

     ;
  • utilisation d'intervalles de 1000 $ ;
  • sortie des résultats à l'écran.

Étapes

Vous pouvez stratifier les données en regroupant les enregistrements dans une table par intervalles numériques à taille égale ou personnalisée.

Pour chaque intervalle, vous pouvez éventuellement inclure les calculs suivants pour les champs numériques associés : sous-total, valeur moyenne, valeur minimale, valeur maximale.