CVSSAMPLE 命令
概念信息
使用传统变量抽样方法抽取记录样本。
语法
CVSSAMPLE ON 账面价值域 NUMSTRATA 数量 <SEED 种子值> CUTOFF 值 <BCUTOFF 值> STRATA 边界值 <,...n> SAMPLESIZE 数量 <,...n> POPULATION 层计数, 层值 <,...n> <IF 测试> TO 表名称
参数
说明
如果您使用 CVSPREPARE 命令的输出结果作为 CVSSAMPLE 命令的输入,则一些参数值已被指定和存储在变量中。有关详细信息,请参见CVSPREPARE 命令。
指定值时,不要包括千位分隔符或百分号。
| 名称 | 描述 |
|---|---|
| ON 账面价值域 | 要用作样本基础的数值类型账面价值域。 |
| NUMSTRATA 数量 | 要用来对账面价值域进行分层的层数。 |
| SEED 种子值 可选 |
要用来在 Analytics 中初始化随机数生成器的种子值。 如果省略 SEED,则 Analytics 会随机选择种子值。 |
| CUTOFF 值 |
一个最高确定性层截止值。 账面价值域中大于或者等于截止值的金额会被自动选择并包括在样本中。 |
| BCUTOFF 值 可选 |
一个最低确定性层截止值。 账面价值域中小于或者等于截止值的金额会被自动选择并包括在样本中。 |
| STRATA 边界值 <,...n> | 要用来对账面价值域进行分层的上边界值。 |
| SAMPLESIZE 数量 <,...n> | 要从每个层抽取的记录数。 |
| POPULATION 层计数, 层值 <,...n> | 每个层中的记录数以及每个层的合计价值。 |
| IF 测试 可选 |
一个条件表达式,它必须为真以便处理每个记录。仅对满足条件的那些记录执行该命令。 注意 如果您指定一个条件表达式,则必须在计算样本量和抽取样本的过程中使用相同的条件表达式。 如果您在一个阶段使用条件而未在另一个阶段使用,或者如果两个条件不相同,则抽样结果将很可能在统计意义上无效。 |
| TO 表名 |
要将命令结果发送到的位置:
|
Analytics 输出变量
| 名称 | 包含 |
|---|---|
| S_TOPEV |
由用户指定的最高确定性层截止值,或者如果未指定,则是由 CVSPREPARE 命令以前计算的顶层上边界值。 另外还存储最高确定性层中的记录数及其合计货币值。 |
| SBOTTOMEV |
由用户指定的最低确定性层截止值,或者如果未指定,则是由 CVSPREPARE 命令以前计算的底层下边界。 另外还存储最低确定性层中的记录数及其合计货币值。 |
| SBOUNDARYEV | 由该命令预先填充或者由用户指定的所有层上边界值。不包括最高或最低确定性层。 |
| SPOPULATION | 每个层中的记录数以及每个层的合计货币值。不包括最高或最低确定性层。 |
示例
抽取传统变量样本
您将要使用传统变量抽样来估计包含发票的账户中货币错报的总金额。
在对总体进行分层并且为每个层计算在统计学意义上有效的样本量后,您准备好抽取样本。
下面的示例基于发票金额域抽取分层记录样本,并且将抽样记录输出到发票样本表:
CVSSAMPLE ON 发票金额 NUMSTRATA 5 SEED 12345 CUTOFF 35000.00 STRATA 4376.88,9248.74,16904.52,23864.32,35000.00 SAMPLESIZE 37,36,49,36,39 POPULATION 1279,3382131.93,898,5693215.11,763,9987014.57,627,12657163.59,479,13346354.63 TO "发票样本"
备注
有关此命令工作方式的详细信息,请参见执行传统变量抽样。
系统生成域
Analytics 自动生成四个域并将其添加到样本输出表中。对于该样本中包括的每个记录,这些域都包含以下描述性信息:
- STRATUM 将记录分配到的层编号
- ORIGIN_RECORD_NUMBER 源数据表中的原始记录编号
- SELECTION_ORDER 对于每个层而言,随机选择记录的顺序
- SAMPLE_RECORD_NUMBER 样本输出表中的记录编号