在此任务中,你将使用数据挖掘设计器的 “挖掘模型 ”选项卡定义另外两个模型。 你将使用Microsoft聚类分析和Microsoft Naive Bayes 算法来创建模型。 选择这两种算法是因为它们能够预测离散值(即自行车购买)。 有关这些算法的详细信息,请参阅 Microsoft聚类分析算法 和 Microsoft Naive Bayes 算法
创建聚类挖掘模型
切换到 SQL Server Data Tools (SSDT) 中的数据挖掘设计器中的 “挖掘模型 ”选项卡。
请注意,设计器显示两列,一列用于挖掘结构,另一列用于在上一课中创建的
TM_Decision_Tree挖掘模型。右键单击 “结构 ”列,然后选择“ 新建挖掘模型”。
在“ 新建挖掘模型 ”对话框中的 “模型名称”中,键入
TM_Clustering。在 算法名称中,选择 Microsoft聚类分析。
单击 “确定” 。
新模型现在显示在数据挖掘设计器的 “挖掘模型 ”选项卡中。 此模型使用Microsoft聚类分析算法构建,将具有相似特征的客户分组到群集中,并预测每个群集的自行车购买情况。 尽管可以修改新模型的列用法和属性,但本教程不需要对 TM_Clustering 模型进行更改。
创建 Naive Bayes 挖掘模型
在数据挖掘设计器的“ 挖掘模型 ”选项卡中,右键单击 “结构 ”列,然后选择“ 新建挖掘模型”。
在“ 新建挖掘模型 ”对话框中的 “模型名称”下,键入
TM_NaiveBayes。在 算法名称中,选择 Microsoft Naive Bayes,然后单击“ 确定”。
此时会显示一条消息,指出Microsoft Naive Bayes 算法不支持连续的 “年龄 ”和 “年收入 ”列。
单击“ 是 ”确认消息并继续。
数据挖掘设计器的 “挖掘模型 ”选项卡中会显示一个新模型。 尽管可以修改此选项卡中所有模型的列用法和属性,但本教程不需要对 TM_NaiveBayes 模型进行更改。