执行货币单位抽样
概念信息
可创建一个新表,使其包含活动表中货币数据的代表样本。
如果您对文件中的货币错报总金额感兴趣,则货币单位抽样是适当的。
说明
此过程不包含过滤(IF 语句)或范围参数,因为应用这些选项会损害样本的有效性。
步骤
- 在导航器中,打开您想要从中抽取样本的表。
- 可选。如果您打算使用随机选择方法,请对样本域进行剖析或者生成统计信息。
- 选择抽样 > 记录/货币单位抽样 > 样本。
- 在主要选项卡上,选择 MUS。
- 从抽样对象下拉列表中,选择要抽样的域。
- 在抽样参数面板中,指定样本选择方法:
- 固定间隔
- 单元
- 随机
说明
如果您打算使用 Analytics 评估在生成的样本中检测到的任何错报,请不要对货币单位抽样使用随机选择方法。
评估货币单位样本要求您使用固定间隔或单元选择方法。
- 输入您所选的选择方法的样本参数:
选择方法 样本参数 固定间隔 - 间隔
- 开始(可选)
- 截止(可选)
单元 - 间隔
- 种子(可选)
- 截止(可选)
- 算法 – 使梅森旋转算法保持选定状态
随机 - 大小
- 种子(可选)
- 总体
- 算法 – 使梅森旋转算法保持选定状态
说明
下面详细解释了参数样例。
- 在到文本框中,指定将包含输出结果的 Analytics 表的名称。
- 在更多选项卡上,选择下列选项之一:
记录整个记录被包括在输出表中。
域只有选定的域被包括在输出表中。
- 如果您选择了域,请从提取域列表中选择要包括在输出表中的域。
- 可选。请选择以下一或多个选项:
- 子样本
- 报告选择顺序
- 无重复
说明
下面解释了这些选项。
只有选择域输出时才可使用子样本。
只有同时选择随机选择方法和域输出后,才可使用报告选择顺序。
- 单击确定。
“样本”对话框选项
下表提供了有关样本对话框中选项的详细信息。
“主要”选项卡
| 选项 –“样本”对话框 | 描述 |
|---|---|
| MUS
记录 |
样本类型:
|
| 域抽样 |
数值样本域。
|
| 固定间隔 |
指定使用固定间隔方法来选择样本。 根据您指定的间隔值和起始编号来选择样本。有关详细信息,请参见固定间隔选择方法。 如果您选择了固定间隔,请输入以下值:
|
| 单元 |
指定使用单元方法来选择样本。 数据集被划分为多个相同大小的单元或组,并且从每个单元中随机选择一个样本。该间隔值指示每个单元的大小。有关详细信息,请参见单元选择方法。 如果您选择了单元,请输入以下值:
|
| 随机 |
指定使用随机方法来选择样本。 将从整个数据集中随机选择样本。有关详细信息,请参见随机选择方法。 如果您选择了随机,请输入以下值:
|
| 如果 | |
| 到 | 输出表的名称和位置。
无论将输出表保存到何处,打开项目时,如果该项目中还没有此表,则会将其添加到该项目中。 如果 Analytics 预填充了一个表名称,您可以接受预填充的名称或更改它。 说明 Analytics 表名称限制为 64 个字母数字字符,且不包括 .FIL 扩展名。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。 |
| 本地 |
如果您被连接到服务器表,请指定在何处保存输出表。
|
| 使用输出表 | 指定包含输出结果的 Analytics 表在完成操作后是否自动打开。 |
“更多”选项卡
| 选项 –“样本”对话框 | 描述 |
|---|---|
| 范围面板 | |
|
记录 域 |
指定输出表是包括整个记录还是只包括选定的域。 如果您选择域,请执行以下操作之一: 从提取域列表选择要提取的域。 单击提取域,来选择域或创建表达式。 域选择的顺序就是列在结果中显示的顺序。如果要将结果附加到现有的 Analytics 表中,列选择和顺序必须与现有表中的列选择和顺序完全相同。 |
|
子样本 报告选择顺序 无重复 |
(可选)附加抽样选项。 您可以选择下列一个或多个选项:
说明 只有选择域输出时才可使用子抽样。 只有同时选择随机选择方法和域输出后,才可使用报告选择顺序。 选择无重复后,选定的记录失去在后续选择中获选的资格,这可能减小样本量。您应该考虑对数据集进行过抽样,以便予以补偿。 有关详细信息,请参见无重复样本选择。 |
| 附加到现有文件 | 指定将输出结果附加(添加)到现有 Analytics 表的末尾。 |
| 确定 | 执行操作。 如果覆盖提示出现,请选择合适的选项。 如果您想让附加选项显示出来,而实际上未显示,请单击否取消操作并参见将输出结果附加到现有表。 |
货币单位抽样选项
对于货币单位抽样,可以指定下列选项中的一个或多个:
- 顶层截止点
- 子抽样
- 无重复样本选择
顶层截止点
说明
顶层截止点仅对使用固定间隔或单元选择方法的货币单位抽样可用。
顶层截止点是一种附加的方法,Analytics 使用该方法使货币单位抽样偏好较大的金额。默认情况下,大于或者等于间隔值的样本域金额被视为顶层金额,并且被自动包括在样本中。
无论是负金额还是正金额,都有资格被自动选择,因为考虑的是金额的绝对值。
请注意,自动选择的金额越大,样本量就会变得越大。
您可以有选择地指定一个高于或低于间隔值的顶层截止日。
| 顶层截止日值 | 影响 |
|---|---|
|
高于间隔值 |
降低较大的金额将被自动包括在样本中的可能性。 如果您指定一个比样本域中的最大正数或负数金额还要大的截止值,则没有金额会被自动选择。 |
|
低于间隔值 |
提高较大的金额将被自动包括在样本中的可能性。 如果使用默认顶层截止值不会自动选择任何金额,您可以向下调整截止值,以便自动选择样本域中的某些较大的金额。 注意 如果您指定的截止日值相对于抽样域金额显得太小,则会自动选择过多的金额,这违背了抽样的目的。 |
被记录在日志中的顶层选择和金额
当您执行货币单位抽样时,顶层选择的数量和顶层总金额将显示在日志中。
示例
日志显示,93 个选定记录中的 8 个属于顶层,在数值样本域的绝对值中占了 $33,153.55。
样本量 = 93 (8 个顶层),抽样自 772 个记录
总体:585674.41,顶层:33153.55,其他:552520.86
子抽样
说明
只有对于使用域输出的货币单位抽样,才可使用子抽样。
在某些情况下,样本域中的每个金额都表示多个单独交易的总和。如果您只想对每个抽样总金额中的单个交易执行审计程序,则可以使用自抽样随机选择单个交易。
当您在样本对话框中选择子样本时,生成的样本将包括“子样本”域。此域包含的金额表示总金额和用于选择该总金额的实际货币单位之间的差异。
示例
| $12,455 | (总金额) |
| - $4,620 | (选定的货币单位) |
| = $7,835 | (SUBSAMPLE 域中显示的金额) |
要完成该过程,您需要选择包含该特定总金额的累计交易余额中的第 7,835 个美元的交易。
说明
该样本中的任何顶层截止金额都会在“子样本”域中显示“0.00”,因为它们被自动包括在样本中,并且其选择不涉及任何货币单位。
无重复样本选择
货币单位抽样可能选择相同记录一次以上。样本域中的每个金额都包含多个货币单位,属于相同金额的两个或更多个货币单位可能被选择,这意味着包含该金额的记录被多次选择。
通过在样本对话框中选择无重复,可以防止多次选择相同记录。生成的样本将不包含重复项。但是,抽样记录的数量可能小于 Analytics 所计算的样本量。为了进行补偿,您可以采取过抽样的方法,即使用下列方法之一来增加样本量:
-
固定间隔或单元选择方法:
- 减小间隔的大小
- 调整顶层截止值以自动选择更大数量的记录
- 随机选择方法可增加指定的样本量