为分析准备数据

您可能需要为您打算分析的数据做一些初始的准备性工作。在某些情况下,您可以在导入数据后立即开始分析数据。但是,通常您需要执行一项或多项准备性任务,以便:

  • 构建您将最终分析的数据集
  • 确保结果可靠

请将准备工作视作生成您的分析的基础。良好的基础对获得有效而可靠的结果至关重要。

常见的准备任务

下面是一些比较常见的准备任务:

  • 转换转换域的数据类型以便可将其用作特定 Analytics 命令的输入,或者与其他域相协调
  • 清理和标准化 清理和标准化输入数据以使输出结果可靠
  • 组合 组合多个表中的数据
  • 抽样 抽取记录样本,因为您可能没有时间或预算来检查数据集中的每个记录

上述任一任务都可能是您执行预期分析之前的绝对必要的第一步。

验证数据

除了准备数据以外,您还应该验证您将要分析的任何数据的完整性和有效性。即使少量无效数据也会使您的所有后续分析无效,并且浪费宝贵的时间和资源。