选择并映射预测查询的输入数据

从挖掘模型创建预测时,通常会通过将新数据馈送到模型中来执行此作。 (例外是时序模型,只能基于历史数据进行预测。若要为模型提供新数据,必须确保数据作为数据源视图的一部分提供。 如果事先知道将用于预测的数据,则可以将其包含在用于创建模型的数据源视图中。 否则,可能需要创建新的数据源视图。 有关详细信息,请参阅 多维模型中的数据源视图

有时,所需的数据可能包含在一对多联接中的多个表中。 这是用于关联模型或序列聚类模型的数据,这些模型使用链接到包含产品或交易详细信息的嵌套表的案例表。 如果模型使用事例嵌套表结构,则用于预测的数据还必须具有事例嵌套表结构。

警告

不能添加新列或映射位于不同数据源视图中的列。 所选数据源视图必须包含预测查询所需的所有列。

确定包含要用于预测的数据的表后,必须将外部数据中的列映射到挖掘模型中的列。 例如,如果模型根据人口统计和调查响应预测客户购买行为,则输入数据应包含通常对应于模型中的内容的信息。 无需为每个列提供匹配的数据,但可以匹配的列越多,就越好。 如果尝试映射数据类型不同的列,可能会出错。 在这种情况下,您可以在数据源视图中定义一个命名计算,以将新列数据转换为模型所需的数据类型。 有关详细信息,请参阅数据源视图中的“定义命名计算”(Analysis Services)。

选择要用于预测的数据时,所选数据源中的某些列可能会根据名称相似性和匹配数据类型自动映射到挖掘模型列。 可以使用“挖掘模型预测”中的“修改映射”对话框更改映射、删除不适当的映射或为现有列创建新映射。 挖掘模型预测设计图面还支持对连接进行拖放编辑。

  • 若要创建新连接,只需选择 挖掘模型 表中的列,然后将其拖到 SelectInput 表(s)表中 的相应列。

  • 若要删除连接,请选择连接线并按 DELETE 键。

以下过程介绍如何使用“ 指定嵌套联接 ”对话框修改在事例表和用作预测查询输入的嵌套表之间创建的联接。

选择输入表

  1. 在 SQL Server Data Tools(SSDT)的数据挖掘设计器中“挖掘准确性图表”选项卡的“选择输入表”表中,单击“选择事例表”。

    此时将打开 “选择表 ”对话框,可在其中选择包含要基于查询的数据的表。

  2. “选择表 ”对话框中,从“ 数据源 ”列表中选择数据源。

  3. “表/视图名称”下,选择包含要用于测试模型的数据的表。

  4. 单击 “确定”

    挖掘结构中的列会自动映射到输入表中具有相同名称的列。

更改输入数据映射到模型的方式

  1. 在 SQL Server Data Tools (SSDT)中的数据挖掘设计器中,选择 “挖掘模型预测 ”选项卡。

  2. “挖掘模型 ”菜单上,选择“ 修改连接”。

    此时将打开 “修改映射 ”对话框。 在此对话框中,列 “挖掘模型列 ”列出所选挖掘结构中的列。 列 表列 列出了你在 SelectInput 表[s] 对话框中选择的外部数据源中的列。 外部数据源中的列映射到挖掘模型中的列。

  3. “表列”下,选择要映射到的挖掘模型列对应的行。

  4. 从外部数据源中的可用列列表中选择一个新列。 选择列表中的空白项以删除列映射。

  5. 单击 “确定”

    新的列映射显示在设计器中。

删除输入表之间的关系

  1. 在 SQL Server Data Tools (SSDT)的数据挖掘设计器中“挖掘模型预测”选项卡的“选择输入表”表上,单击“修改联接”。

    此时将打开 “指定嵌套联接 ”对话框。

  2. 选择关系。

  3. 单击“ 删除关系”。

  4. 单击 “确定”

    已删除事例表和嵌套表之间的关系。

在输入表之间创建新关系

  1. 在数据挖掘设计器中“挖掘模型预测”选项卡的“选择输入表”表中,单击“修改联接”。

    此时将打开 “指定嵌套联接 ”对话框。

  2. 单击“ 添加关系”。

    此时将打开 “创建关系 ”对话框。

  3. 源列中选择嵌套表的键。

  4. 目标列中选择案例表的键。

  5. 在“创建关系”对话框中单击“确定”。

  6. 在“指定嵌套联接”对话框中单击“确定”。

    在事例表和嵌套表之间创建了一个新关系。

将嵌套表添加到预测查询的输入表

  1. 在数据挖掘设计器中的 “挖掘模型预测 ”选项卡上,单击“ 选择事例表 ”以打开 “选择表 ”对话框。

    注释

    除非已指定事例表,否则不能向输入添加嵌套表。 使用嵌套表需要用于预测的挖掘模型也使用嵌套表。

  2. “选择表 ”对话框中,从“ 数据源 ”列表中选择数据源,然后在包含事例数据的数据源视图中选择该表。 单击 “确定”

  3. 单击 “选择嵌套表 ”打开 “选择表 ”对话框。

  4. “选择表 ”对话框中,从“ 数据源 ”列表中选择数据源,然后在数据源视图中选择包含嵌套数据的表。 单击 “确定”

    如果关系已存在,则挖掘模型中的列会自动映射到输入表中具有相同名称的列。 可以通过单击“ 修改联接”来修改嵌套表和事例表之间的关系,这将打开“ 创建关系 ”对话框。

另请参阅

预测查询 (数据挖掘)