创建目标邮件挖掘模型结构(基本数据挖掘教程)

创建目标邮件方案的第一步是使用 SQL Server Data Tools (SSDT) 中的数据挖掘向导创建新的挖掘结构和决策树挖掘模型。

在此任务中,你将设置一个新的挖掘结构,并基于Microsoft决策树算法添加初始挖掘模型。 若要创建结构,首先选择表和视图,然后确定将用于训练的列以及用于测试的列。

为精准邮件营销创建数据挖掘结构

  1. 在解决方案资源管理器中,右键单击 “挖掘结构 ”,然后选择“ 新建挖掘结构 ”以启动数据挖掘向导。

  2. 在“ 欢迎使用数据挖掘向导” 页上,单击“ 下一步”。

  3. “选择定义方法 ”页上,验证是否选择了 “从现有关系数据库或数据仓库 ”,然后单击“ 下一步”。

  4. 在“ 创建数据挖掘结构 ”页上, 在要使用的数据挖掘技术下,选择 Microsoft决策树

    注释

    如果收到无法找到任何数据挖掘算法的警告,则可能无法正确配置项目属性。 当项目尝试从 Analysis Services 服务器检索数据挖掘算法列表且找不到服务器时,将发生此警告。 默认情况下,SQL Server Data Tools 将使用 localhost 作为服务器。 如果使用其他实例或命名实例,则必须更改项目属性。 有关详细信息,请参阅创建 Analysis Services 项目(基本数据挖掘教程)。

  5. 单击 “下一步”

  6. “选择数据源视图 ”页上的 “可用数据源视图 ”窗格中,选择 “目标邮件”。 可以单击“ 浏览 ”以查看数据源视图中的表,然后单击“ 关闭 ”返回到向导。

  7. 单击 “下一步”

  8. 在“指定表类型”页上,选中 vTargetMail 在 Case 列中的复选框以将其用作案例表,然后单击“下一步”。 稍后您将使用“潜在买家”表进行测试;现在请暂时忽略它。

  9. “指定训练数据 ”页上,你将识别模型至少一个可预测列、一个键列和一个输入列。 选中 BikeBuyer 行的“可预测”列中的复选框。

    注释

    请注意窗口底部的警告。 在您选择至少一个 输入 列和一个 可预测 列之前,您将无法导航到下一页。

  10. 单击 “建议 ”以打开“ 建议相关列 ”对话框。

    选择至少一个可预测属性时,将启用 “建议 ”按钮。 “ 建议相关列 ”对话框列出了最与可预测列最相关的列,并按其与可预测属性的关联对属性进行排序。 将自动选择具有显著相关性(置信度大于 95%)的列包含在模型中。

    查看建议,然后单击取消以忽略建议。

    注释

    如果单击“ 确定”,所有列出的建议都将标记为向导中的输入列。 如果只同意某些建议,则必须手动更改值。

  11. 验证 Key 列中的复选框是否在 CustomerKey 行中选择。

    注释

    如果数据源视图中的源表指示键,则数据挖掘向导会自动选择该列作为模型的键。

  12. 选中以下行的 “输入 ”列中的复选框。 可以通过突出显示单元格区域并在选中复选框时按 Ctrl 来检查多个列。

    • 年龄

    • CommuteDistance

    • EnglishEducation

    • 英语职业

    • GeographyKey

    • HouseOwnerFlag

    • 婚姻统计

    • NumberCarsOwned

    • 家中的孩子人数

    • 区域

    • TotalChildren

    • YearlyIncome

  13. 在页面最左侧的列中,选中以下行中的复选框。

    • AddressLine1

    • AddressLine2

    • 首次购买日期

    • EmailAddress

    • 名字

    • 姓氏

    确保这些行仅在左侧列中被勾选。 这些列将添加到结构中,但不会包含在模型中。 但是,在模型构建完成后,它们将可用于钻取和测试。 有关钻取的详细信息,请参阅 钻取查询(数据挖掘)

  14. 单击 “下一步”

课程中的下一个任务

指定数据类型和内容类型(基本数据挖掘教程)

另请参阅

指定表类型(数据挖掘向导)
数据挖掘设计器
Microsoft决策树算法