创建目标邮件方案的第一步是使用 SQL Server Data Tools (SSDT) 中的数据挖掘向导创建新的挖掘结构和决策树挖掘模型。
在此任务中,你将设置一个新的挖掘结构,并基于Microsoft决策树算法添加初始挖掘模型。 若要创建结构,首先选择表和视图,然后确定将用于训练的列以及用于测试的列。
为精准邮件营销创建数据挖掘结构
在解决方案资源管理器中,右键单击 “挖掘结构 ”,然后选择“ 新建挖掘结构 ”以启动数据挖掘向导。
在“ 欢迎使用数据挖掘向导” 页上,单击“ 下一步”。
在 “选择定义方法 ”页上,验证是否选择了 “从现有关系数据库或数据仓库 ”,然后单击“ 下一步”。
在“ 创建数据挖掘结构 ”页上, 在要使用的数据挖掘技术下,选择 Microsoft决策树。
注释
如果收到无法找到任何数据挖掘算法的警告,则可能无法正确配置项目属性。 当项目尝试从 Analysis Services 服务器检索数据挖掘算法列表且找不到服务器时,将发生此警告。 默认情况下,SQL Server Data Tools 将使用 localhost 作为服务器。 如果使用其他实例或命名实例,则必须更改项目属性。 有关详细信息,请参阅创建 Analysis Services 项目(基本数据挖掘教程)。
单击 “下一步” 。
在 “选择数据源视图 ”页上的 “可用数据源视图 ”窗格中,选择 “目标邮件”。 可以单击“ 浏览 ”以查看数据源视图中的表,然后单击“ 关闭 ”返回到向导。
单击 “下一步” 。
在“指定表类型”页上,选中 vTargetMail 在 Case 列中的复选框以将其用作案例表,然后单击“下一步”。 稍后您将使用“潜在买家”表进行测试;现在请暂时忽略它。
在 “指定训练数据 ”页上,你将识别模型至少一个可预测列、一个键列和一个输入列。 选中 BikeBuyer 行的“可预测”列中的复选框。
注释
请注意窗口底部的警告。 在您选择至少一个 输入 列和一个 可预测 列之前,您将无法导航到下一页。
单击 “建议 ”以打开“ 建议相关列 ”对话框。
选择至少一个可预测属性时,将启用 “建议 ”按钮。 “ 建议相关列 ”对话框列出了最与可预测列最相关的列,并按其与可预测属性的关联对属性进行排序。 将自动选择具有显著相关性(置信度大于 95%)的列包含在模型中。
查看建议,然后单击取消以忽略建议。
注释
如果单击“ 确定”,所有列出的建议都将标记为向导中的输入列。 如果只同意某些建议,则必须手动更改值。
验证 Key 列中的复选框是否在 CustomerKey 行中选择。
注释
如果数据源视图中的源表指示键,则数据挖掘向导会自动选择该列作为模型的键。
选中以下行的 “输入 ”列中的复选框。 可以通过突出显示单元格区域并在选中复选框时按 Ctrl 来检查多个列。
年龄
CommuteDistance
EnglishEducation
英语职业
性
GeographyKey
HouseOwnerFlag
婚姻统计
NumberCarsOwned
家中的孩子人数
区域
TotalChildren
YearlyIncome
在页面最左侧的列中,选中以下行中的复选框。
AddressLine1
AddressLine2
首次购买日期
EmailAddress
名字
姓氏
确保这些行仅在左侧列中被勾选。 这些列将添加到结构中,但不会包含在模型中。 但是,在模型构建完成后,它们将可用于钻取和测试。 有关钻取的详细信息,请参阅 钻取查询(数据挖掘)
单击 “下一步” 。