创建市场篮结构和模型(中间数据挖掘教程)

创建数据源视图后,将使用数据挖掘向导创建新的挖掘结构。 在此任务中,你将创建基于Microsoft关联算法的挖掘结构和挖掘模型。

注释

如果遇到错误信息,说明 vAssocSeqLineItems 不能用作嵌套表,请返回到课程中的上一个任务,并确保通过将 vAssocSeqLineItems 表(多方)拖到 vAssocSeqOrders 表(单方),以创建多对一联接。 还可以通过右键单击联接行来编辑表之间的关系。

创建关联挖掘结构

  1. 在 SQL Server Data Tools(SSDT)中的解决方案资源管理器中,右键单击 “挖掘结构 ”,然后选择“ 新建挖掘结构 ”以打开数据挖掘向导。

  2. 在“ 欢迎使用数据挖掘向导” 页上,单击“ 下一步”。

  3. “选择定义方法 ”页上,验证是否选择了 “从现有关系数据库或数据仓库 ”,然后单击“ 下一步”。

  4. 在“ 创建数据挖掘结构 ”页上, 在要使用的数据挖掘技术下,从列表中选择 Microsoft关联规则 ,然后单击“ 下一步”。 此时会显示 “选择数据源视图 ”页。

  5. “可用数据源”视图下选择“订单”,然后单击“下一步”。

  6. 在“ 指定表类型 ”页上,在 vAssocSeqLineItems 表的行中,选中 “嵌套 ”复选框,然后在嵌套表 vAssocSeqOrders 的行中,选中“ Case ”复选框。 单击 “下一步”

  7. “指定训练数据 ”页上,清除可能选中的任何框。 通过选中 OrderNumber 旁边的 “键 ”复选框,设置事例表 vAssocSeqOrders 的键。

    由于市场篮分析的目的是确定单个交易中包含的产品,因此无需使用 CustomerKey 字段。

  8. 通过选中“模型”旁边的 “键 ”复选框,设置嵌套表 vAssocSeqLineItems 的键。 执行此作时,也会自动选中“ 输入 ”复选框。 同时选中 “可预测 ”复选框 Model

    在市场篮模型中,你不关心购物篮中的产品序列,因此不应将 LineNumber 作为嵌套表的键。 仅当序列很重要的模型中,才使用 LineNumber 作为键。 你将创建一个模型,该模型使用第 4 课中的Microsoft序列聚类分析算法。

  9. 选中 IncomeGroup 和 Region 左侧的复选框,但不进行任何其他选择。 检查最左侧的列会将列添加到结构以供以后引用,但不会在模型中使用该列。 你的选择应如下所示:

    对话框的外观

  10. 单击 “下一步”

  11. 在“ 指定列的内容和数据类型”页上,查看应如下表所示的选择,然后单击“ 下一步”。

    内容类型 数据类型
    收入组 离散 文本
    订单号 密钥 文本
    区域 离散 文本
    vAssocSeqLineItems
    型号 密钥 文本
  12. “创建测试集 ”页上, 用于测试的选项百分比 的默认值为 30%。 将此更改为 0。 单击 “下一步”

    注释

    Analysis Services 提供用于测量模型准确性的不同图表。 但是,某些准确性图表类型(如提升图和交叉验证报告)用于分类和估计。 它们在关联预测中不受支持。

  13. “完成向导” 页上的 “挖掘结构名称”中,键入 Association

  14. 挖掘模型名称中,键入 Association

  15. 选择“ 允许钻取”选项,然后单击“ 完成”。

    数据挖掘设计器随即打开,以显示您刚创建的Association挖掘结构。

课程中的下一个任务

修改和处理市场篮模型 (中间数据挖掘教程)

另请参阅

Microsoft关联算法
内容类型(数据挖掘)