PREDICT 命令

将一个预测模型应用于一个未标记的数据集,以预测与单个记录相关联的类别或数值类型值。

说明

如果您是在 32 位计算机上运行 Analytics,则 PREDICT 命令不受支持。该命令所需的计算是处理器密集型的,并且更适合于 64 位计算机。

语法

PREDICT MODEL 模型名称 TO 表名称 <IF 测试> <WHILE 测试> <FIRST 范围|NEXT 范围>

参数

名称 描述
MODEL 模型名称

要用来预测类别或值的模型文件的名称。您使用一个先前由 TRAIN 命令生成的模型文件。

您必须指定 *.model 文件扩展名。例如:

MODEL "Loan_default_prediction.model"

说明

培训该模型文件时所使用的数据集必须包含与未标记的数据集相同或基本上相同的域。

您不能使用在 Analytics 的版本 14.1 中培训的模型文件。版本 14.1 模型文件不与后续版本的 Analytics 兼容。培训一个新的预测模型以与 PREDICT 命令一起使用。

TO 表名

该预测流程所输出的 Analytics 表的名称。

该表包含您在培训流程中指定的键域,以及一个或两个由预测流程生成的域:

  • 已预测 与未标记的数据集中的每个记录相关联的已预测种类或数值类型值
  • 概率(仅分类)预测类准确的概率

请将表名称指定为具有 .FIL 文件扩展名的带引号的字符串。例如:TO "Loan_applicants_default_predicted.FIL"

默认情况下,表数据文件 (.FIL) 被保存到包含 Analytics 项目的文件夹。

请使用绝对或相对文件路径将该数据文件保存到另外的现有文件夹:

  • TO "C:\Loan_applicants_default_predicted.FIL"
  • TO "ML Predict output\Loan_applicants_default_predicted.FIL"

说明

表名称被限制为不超过 64 个字母数字字符(不包括 .FIL 扩展名)。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。

IF 测试

可选

一个条件表达式,它必须为真以便处理每个记录。仅对满足条件的那些记录执行该命令。

说明

在应用任何范围参数(WHILE、FIRST、NEXT)之后,仅针对表中的剩余记录评估 IF 条件。

WHILE 测试

可选

一个条件表达式,它必须为真以便处理每个记录。该命令被一直执行到条件的计算结果为假或者到达表的末尾为止。

说明

如果您将 WHILE 与 FIRST 或 NEXT 结合使用,请在达到一个限制时立即记下处理步骤。

FIRST 范围 | NEXT 范围

可选

要处理的记录数:

  • FIRST 从第一个记录开始处理,直到达到指定的记录数为止
  • NEXT 从当前选定的记录开始处理,直到达到指定的记录数为止

请使用范围指定要处理的记录数。

如果您省略 FIRST 和 NEXT,则会默认处理所有记录。

示例

使用一个分类模型进行预测

您将一个分类模型输入到 PREDICT 命令中,以便预测哪些当前贷款申请人在获得贷款后将违约。

您先前使用 TRAIN 命令和一组历史贷款数据(包括贷款违约信息)生成了该分类模型。

OPEN "Loan_applicants_current"
PREDICT MODEL "Loan_default_prediction.model" TO "Loan_applicants_default_predicted.FIL"

使用回归模型进行预测

您向 PREDICT 命令输入一个回归模型来预测未来的房屋销售价格。

您之前使用 TRAIN 命令生成了回归模型,其中包含一组最近的房屋销售数据,包括销售价格。

OPEN "House_price_evaluation"
PREDICT MODEL "House_price_prediction.model" TO "House_prices_predicted.FIL"

备注

有关此命令工作方式的详细信息,请参见预测种类和数值类型值