准备传统变量样本
概念信息
在对一个数据集进行抽样之前,您必须对包含记录的表进行分层,并且为每个层计算在统计学意义上有效的样本量。
Analytics 中的 CVS 准备功能根据您提供的输入值计算所需的值。
计算样本量的重要性
计算适当的样本量对于后续样本的有效性而言至关重要。如果样本无效或者不具有代表性,则您无法将对样本执行的审计程序的结果可靠地推断至整个总体。
请勿跳过计算样本量的流程,或者猜测样本量。
您用来计算样本量的大多数输入值都基于您的职业判断。在生产环境中依赖抽样结果之前,请确保您完全了解这些值的含义。如有疑问,请咨询审计抽样资源或审计抽样专家。
数值长度限制
在传统变量抽样的准备阶段,会发生多个内部计算。这些计算支持最大长度为 17 位的数字。如果任何计算的结果超过 17 位,则该结果不会被包括在输出中,并且您无法继续执行抽样流程。
请注意,少于 17 位的源数据数字可能生成超过 17 位的内部计算结果。
精度限值工作原理
当您准备传统变量样本时,您必须为精度限值选择下面列出的选项之一。
您选择的选项决定了您在抽样流程的 CVS 评估阶段生成的估计范围的类型。
您需要在准备阶段的这一时刻选择一个选项,因为您选择的选项是计算样本量的前提条件之一。
| 精确度限制 | 对于 CVS 评估阶段的该类型估计: |
|---|---|
| 两者 (BOTH) | 一个具有点估计和上、下限的双限值范围 |
| 上限 (UPPER) | 一个具有点估计和上限的单限值范围 |
| 下限 (LOWER) | 一个具有点估计和下限的单限值范围 |
范围的“单双限值性”
范围的“单双限值性”派生自构成传统变量抽样基础的正态分布或钟形曲线。
双限值范围
如果您正在检查某个整体上可能被高报或低报的账户,则通常您感兴趣的是任一方向的错报是否超过您断定可容忍或可接受的错报金额。
您需要一个双限值范围或估计:
- 下限是在您指定的置信水平下,账户中存在最大高报金额的估计
- 上限是在您指定的置信水平下,账户中存在最大低报金额的估计
单限值范围
如果您正在检查某个整体上可能被高报或低报的账户,则通常您唯一感兴趣的是某一方向的错报是否超过您断定可容忍或可接受的错报金额。
您可以使用单限值范围或估计:
- 只有下限的范围是在您指定的置信水平下,账户中存在最大高报金额的估计
- 只有上限的范围是在您指定的置信水平下,账户中存在最大低报金额的估计
我应该使用双限值还是单限值范围?
在 CVS 评估阶段,使用双限值范围是更稳健的选择。双限值范围使您可以判断某个账户是否得到适当报告,而无论该账户中的总体错报方向如何。
使用单限值范围的优点是您可以减小需要的样本量,从而减少分析样本数据所需的工作和成本。减少的幅度各不相同,但通常低于 50%。
使用单限值范围的风险是如果您猜错了账户中的总体错报方向,则可能在未检查的方向错过重大错报,并且做出有关帐户余额公正性的不正确判断。
输入值如何影响样本量
输入值影响 Analytics 所计算的样本量。您可以在 CVS 准备对话框中试验不同的输入值,以查看它们如何影响样本量。
注意
在生产环境中,请不要单独操纵输入值以取得较小的样本量。输入值应该基于您的关于什么样的输入值对所抽样的数据最适当的职业判断以及您的审计目标。
| 增加此输入值: | 减小样本量 | 增加样本量 |
|---|---|---|
| 层编号 |
在某个点之后,增加层数对样本量几乎没有影响或者没有任何影响 |
|
| 单元数 |
请根据数据的性质增加或者减小样本量,但通常应该减小样本量 在某个点之后,增加单元数对样本量几乎没有影响或者没有任何影响 |
|
| 最小层样本量 |
如果最小阈值在一个或更多个层中适用,请增加样本量 |
|
| 最小合计样本量 |
如果最小阈值适用,请增加样本量 |
|
| 最高确定性层截止值 |
请根据数据的性质增加或者减小样本量 如果数据中的值的分布比较均匀,则较高的最高确定性层截止值会减小样本量 |
|
| 最低确定性层截止值 |
|
请根据数据的性质增加或者减小样本量 如果数据中的值的分布比较均匀,则较高的最低确定性层截止值会增加样本量 说明 对于负的截止值,“较高”意味着接近于零 (0)。 |
| 置信水平(%) |
|
|
| 货币精度 |
|
|
| 预期误差数 | 对样本量无影响 | |
| 精确度限制 | 两者需要一个比上限或下限更大的样本量 | |
步骤
说明
指定值时,不要包括千位分隔符或百分号。这些字符会阻碍该命令运行,或者导致错误。
- 打开包含您打算抽样的账面价值的表。
- 选择抽样 > 传统变量抽样 (CVS) > 准备。
说明
如果表未打开,则该菜单选项被禁用。
- 在主要选项卡上,从账面价值下拉列表中选择账面价值域。
- 在精度限值下拉列表中,选择一个适当的选项:
- 两者
- 上限
- 下限
说明
下面详细解释了这些选项。
- 输入用于准备样本设计的输入值:
- 层编号
- 单元数
- 最小层样本量
- 最小合计样本量
- 最高确定性层截止值
- 最低确定性层截止值
- 置信水平 (%)
- 货币精度
- 预期误差数
说明
下面详细解释了输入值。
- 可选。如果当前视图中有想要从处理中排除的记录,请在如果文本框中输入一个条件,或单击如果使用表达式生成器创建 IF 语句。
警告
如果您指定一个条件表达式,则必须在计算样本量和抽取样本的过程中使用相同的条件表达式。
如果您在一个阶段使用条件而未在另一个阶段使用,或者如果两个条件不相同,则抽样结果将很可能在统计意义上无效。
- 在输出选项卡上:
- 在到面板中,选择下列选项之一:
- 屏幕 – 在 Analytics 显示区域中显示结果
提示
您可以单击显示区域中的任何链接结果值以向下追溯到源表中的关联记录。
- 文件 将结果保存或附加到文本文件
该文件被保存到 Analytics 的外部。
- 屏幕 – 在 Analytics 显示区域中显示结果
- 如果您选择了文件作为输出类型,请执行以下操作之一:
- 在名称文本框中输入文件名称。
- 单击名称并输入一个文件名,或者在保存或文件另存为对话框中选择一个现有的文件以覆盖或附加到该文件。
如果 Analytics 预填充文件名,您可以接受预填充的名称,也可以更改它。
您还可以指定一个绝对或相对路径,或导航到一个不同的文件夹,将文件保存或附加到与项目位置不同的位置。例如:C:\Results\Output.txt 或 Results\Output.txt。
说明
ASCII 文本文件或 Unicode 文本文件(具体取决于您所使用的 Analytics 的版本)是文件类型的仅有选项。
- 在到面板中,选择下列选项之一:
- 单击确定。
CVS 准备输出结果被显示在屏幕上或者被保存到文件中。
显示内容中包括 CVSSAMPLE 命令的预填充版本。
说明
下面详细解释了输出结果。
请保存该 CVSSAMPLE 命令以供以后使用(可选)
为了方便起见,您可以保存 CVSSAMPLE 命令,以供您在准备好传统变量样本后使用。
- 在 CVS 准备显示区域的底部,单击 CVSSAMPLE 链接将该命令加载到命令行中。
- 从命令行中复制整个命令并将其保存在 Analytics 脚本中。
在准备好样本后,您可以使用 CVS 抽样对话框或者 CVSSAMPLE 命令抽取记录样本。
“CVS 准备”对话框输入和结果
下表提供了有关 CVS 准备对话框中的输入值和输出结果的详细信息。
“主要”选项卡 – 输入值
|
输入值 –“CVS 准备”对话框 |
描述 |
|---|---|
| 账面价值 | 包含您要审计的账面价值的域。 |
| 精确度限制 |
要使用的精度限值的类型。 两者 (BOTH) 在以下条件下选择此选项:
上限 (UPPER) 在以下条件下选择此选项:
下限 (LOWER) 在以下条件下选择此选项:
注意 如果您不确定选择哪个选项,请选择两者。有关详细信息,请参见精度限值工作原理。 |
| 层编号 |
要用来对数据集进行数值分层的层(子组)数。 最小层数是 1,最大层数是 256。 如果您指定确定性层,则它不会被包括在层数中。 有关详细信息,请参见分层。 说明 层数不能超过单元数的 50%。 |
| 单元数 |
要用来预先对数据集进行分层的单元数。 最小单元数是 2,最大单元数是 999。 有关详细信息,请参见分层。 说明 单元数必须最小为层数的两倍 (2 x)。 |
| 最小层样本量 | 要从每个层抽取的最小记录数。 |
| 最小合计样本量 | 要从整个数据集中抽取的最小记录数。 |
| 最高确定性层截止值 |
可选。一个最高确定性层截止值。 账面价值域中大于或者等于该截止值的金额会被自动选择并包括在样本中。 如果您不指定截止值,则会使用一个默认的截止值以确保没有记录被包括在最高确定性层中: 大于 (>) 账面价值域中的最大金额
有关详细信息,请参见确定性层。 |
| 最低确定性层截止值 |
可选。一个最低确定性层截止值。 账面价值域中小于或者等于截止值的金额会被自动选择并包括在样本中。 如果您不指定截止值,则会使用一个默认的截止值以确保没有记录被包括在最低确定性层中: 小于 (<) 账面价值域中的最小金额
有关详细信息,请参见确定性层。 |
| 置信水平(%) |
表明生成的样本代表整个总体所需的置信水平。 例如,输入 95 意味着您想要确信样本实际具有代表性的概率为 95%。 置信度与“抽样风险”互补。95% 的置信水平等价于 5% 的抽样风险。
|
|
货币精度 |
账户中的可容忍错报和预期错报之间的货币金额差异。 例如,如果可容忍错报是 $29,000,预期错报是 $5,800,则输入 23200(差异为 $23,200)。 该货币精度确立了要将账户视为被适当报告的可接受性范围。 |
| 预期误差数 |
可选。您预期样本中含有的最小误差数。 此值在任何 CVS 计算中皆未使用。相反,它被用来在下列任一情况下触发通知:
在上述任一情况下,唯一可用的评估方法是单位平均估计。 |
输出结果
| 输出结果 – CVS 准备 | 描述 |
|---|---|
| 货币精度 | 您指定为输入的货币精度。 |
| 置信水平 | 您指定为输入的置信水平。 |
| 层编号 |
一个被分配给每个层的顺序递增的数字。 确定性层还被分配编号,尽管它们不会显示在此屏幕上:
|
| 层边界 |
每个层的上边界以及最低和最高确定性层截止值。 在下列情况下,账面价值被分配给某个层:
如果账面价值小于或者等于截止值,则它们会被分配到最低确定性层。 如果账面价值大于或者等于截止值,则它们会被分配到最高确定性层。 |
| 总体项 |
该表中的记录数(按层划分,并且包括确定性层)。 |
| 计数百分比 | 每个层(包括确定性层)中包含的记录数的百分比。 |
| 金额百分比 | 每个层(包括确定性层)中包含的合计账面价值的百分比。 |
| 总体值 | 该表的合计账面价值(按层划分,并且包括确定性层)。 |
| 样本项 |
所需的合计样本量(按层划分)。包括确定性层中的所有项。 |
| 关联的 CVSSAMPLE 命令 |
用于执行 CVS 抽样阶段的命令,其中预填充了来自 CVS 准备阶段的值。 |