剖析和验证数据

剖析命令使您可以对记录进行计数,合计数值域,以及创建数据的统计资料。

验证命令提供了检查数据集完整性的不同方式。例如,您可以测试数据有效性、数据序列、间隙和重复项。

命令描述

命令 描述

BENFORD

统计一个域中各个前导数字 (1–9) 或前导数字组合的出现次数,并将实际计数与预期计数进行比较。使用 Benford 公式计算预期计数结果。

COUNT

对当前视图中的记录总数进行计数,或者仅对那些满足指定条件的记录进行计数。

DUPLICATES

检测 Analytics 表中是否存在重复值或整个重复记录。

FUZZYDUP

检测字符域内几乎完全相同的值(模糊重复)。

GAPS

检测 Analytics 表中的数值或日期时间域是否在序列数据中包含一个或多个间隙。

OUTLIERS

识别数值域中的统计异常值。可以为整个域识别异常值,或者基于一个或多个字符、数值或日期时间键域中的相同值为单个组进行识别。

PROFILE

Analytics 表中的一个或多个数值域或数值表达式生成摘要统计信息。

SEQUENCE

确定 Analytics 表中的一个或多个域是否按顺序排列,并且识别顺序错误的条目。

STATISTICS

Analytics 表中的一个或多个数值域或日期时间域计算统计信息。

TOTAL

计算 Analytics 表中一个或多个域的合计值。

VERIFY

检查 Analytics 表中的一个或多个域中是否存在数据有效性错误,方法是验证有关数据是否与表布局中的域定义一致。