创建数据源视图后,将使用数据挖掘向导创建新的挖掘结构。 在此任务中,你将创建基于Microsoft关联算法的挖掘结构和挖掘模型。
注释
如果遇到错误信息,说明 vAssocSeqLineItems 不能用作嵌套表,请返回到课程中的上一个任务,并确保通过将 vAssocSeqLineItems 表(多方)拖到 vAssocSeqOrders 表(单方),以创建多对一联接。 还可以通过右键单击联接行来编辑表之间的关系。
创建关联挖掘结构
在 SQL Server Data Tools(SSDT)中的解决方案资源管理器中,右键单击 “挖掘结构 ”,然后选择“ 新建挖掘结构 ”以打开数据挖掘向导。
在“ 欢迎使用数据挖掘向导” 页上,单击“ 下一步”。
在 “选择定义方法 ”页上,验证是否选择了 “从现有关系数据库或数据仓库 ”,然后单击“ 下一步”。
在“ 创建数据挖掘结构 ”页上, 在要使用的数据挖掘技术下,从列表中选择 Microsoft关联规则 ,然后单击“ 下一步”。 此时会显示 “选择数据源视图 ”页。
在“可用数据源”视图下选择“订单”,然后单击“下一步”。
在“ 指定表类型 ”页上,在 vAssocSeqLineItems 表的行中,选中 “嵌套 ”复选框,然后在嵌套表 vAssocSeqOrders 的行中,选中“ Case ”复选框。 单击 “下一步” 。
在 “指定训练数据 ”页上,清除可能选中的任何框。 通过选中 OrderNumber 旁边的 “键 ”复选框,设置事例表 vAssocSeqOrders 的键。
由于市场篮分析的目的是确定单个交易中包含的产品,因此无需使用 CustomerKey 字段。
通过选中“模型”旁边的 “键 ”复选框,设置嵌套表 vAssocSeqLineItems 的键。 执行此作时,也会自动选中“ 输入 ”复选框。 同时选中 “可预测 ”复选框
Model。在市场篮模型中,你不关心购物篮中的产品序列,因此不应将 LineNumber 作为嵌套表的键。 仅当序列很重要的模型中,才使用 LineNumber 作为键。 你将创建一个模型,该模型使用第 4 课中的Microsoft序列聚类分析算法。
选中 IncomeGroup 和 Region 左侧的复选框,但不进行任何其他选择。 检查最左侧的列会将列添加到结构以供以后引用,但不会在模型中使用该列。 你的选择应如下所示:
              
            单击 “下一步” 。
在“ 指定列的内容和数据类型”页上,查看应如下表所示的选择,然后单击“ 下一步”。
列 内容类型 数据类型 收入组 离散 文本 订单号 密钥 文本 区域 离散 文本 vAssocSeqLineItems 型号 密钥 文本 在 “创建测试集 ”页上, 用于测试的选项百分比 的默认值为 30%。 将此更改为 0。 单击 “下一步” 。
注释
Analysis Services 提供用于测量模型准确性的不同图表。 但是,某些准确性图表类型(如提升图和交叉验证报告)用于分类和估计。 它们在关联预测中不受支持。
在 “完成向导” 页上的 “挖掘结构名称”中,键入
Association。在 挖掘模型名称中,键入
Association。选择“ 允许钻取”选项,然后单击“ 完成”。
数据挖掘设计器随即打开,以显示您刚创建的
Association挖掘结构。