新建日期: 2005 年 12 月 5 日
在本课中,您将向在第 1 课:创建自行车购买者挖掘结构中创建的自行车购买者挖掘结构添加两个挖掘模型。您可以使用其中的一个模型浏览数据,使用另一个模型创建预测。
为了研究如何能够将潜在客户按其特征分类,将根据 Microsoft 聚类分析算法创建一个挖掘模型。在下一课中,您将研究该算法如何查找具有类似特征的客户群。例如,您可能发现某些客户住得比较近,骑自行车上下班,并且具有类似的教育背景。可以使用这些客户群更好地了解不同客户之间的关系,并使用此信息创建面向特定客户的营销策略。
为了预测潜在客户是否可能购买自行车,将基于 Microsoft 决策树算法创建一个挖掘模型。该算法会通查与每位潜在客户关联的信息,并查找有助于预测客户是否会购买自行车的特征。然后将先前的自行车购买者的特征值与潜在的新客户的特征值进行比较,确定潜在的新客户是否可能购买自行车。
ALTER MINING STRUCTURE 语句
为了向挖掘结构中添加挖掘模型,可以使用 ALTER MINING STRUCTURE (DMX) 语句。可以将语句中的代码分为下列几部分:
- 标识挖掘结构
- 命名挖掘模型
- 定义键列
- 定义输入列和可预测列
- 标识算法和参数更改
下面是 ALTER MINING MODEL 语句的一般示例:
ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
[<key column>],
<mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
代码的第一行标识挖掘模型将添加到的现有挖掘结构:
ALTER MINING STRUCTURE [<mining structure name>]
代码的第二行命名添加到挖掘结构中的挖掘模型:
ADD MINING MODEL [<mining model name>]
有关在 DMX 中命名对象的信息,请参阅标识符 (DMX)。
代码的接下来的各行定义挖掘结构中将由挖掘模型使用的各列:
[<key column>],
<mining model columns>
您只能使用挖掘结构中现有的各列,列表中的第一列必须是挖掘结构中的键列。
代码的最后一行定义生成挖掘模型的挖掘算法以及可以对算法设置的算法参数:
) USING <algorithm name>( <algorithm parameters> )
有关可以调整的算法参数的详细信息,请参阅 Microsoft 决策树算法和 Microsoft 聚类分析算法。
您可以使用以下语法指定将挖掘模型中的一列用于预测:
<mining model column> PREDICT
课程任务
在本课中,您将执行下列任务:
- 使用 Microsoft 决策树算法向自行车购买者结构中添加决策树挖掘模型
- 使用 Microsoft 聚类分析算法向自行车购买者结构中添加聚类分析挖掘模型
向结构中添加决策树挖掘模型
第一步是基于 Microsoft 决策树算法添加挖掘模型。
添加决策树挖掘模型
在对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。
将
<mining structure name>替换为
Bike Buyer将
<mining model name>替换为
Decision Tree将
<mining model columns>,替换为
( [Customer Key], [Age], [Bike Buyer] PREDICT, [Commute Distance], [Education], [Gender], [House Owner Flag], [Marital Status], [Number Cars Owned], [Number Children At Home], [Occupation], [Region], [Total Children], [Yearly Income]在此情况下,[Bike Buyer] 列被指定为 PREDICT 列。
将
USING <algorithm name>( <algorithm parameters> )替换为
Using Microsoft_Decision_Trees WITH DRILLTHROUGH通过 WITH DRILLTHROUGH 语句,您可以浏览用于生成挖掘模型的事例。
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Bike Buyer] ADD MINING MODEL [Decision Tree] ( [Customer Key], [Age], [Bike Buyer] PREDICT, [Commute Distance], [Education], [Gender], [House Owner Flag], [Marital Status], [Number Cars Owned], [Number Children At Home], [Occupation], [Region], [Total Children], [Yearly Income] ) USING Microsoft_Decision_Trees WITH DRILLTHROUGH在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。
在**“另存为”**对话框中,浏览到适当的文件夹,并将文件命名为 DT_Model.dmx。
在工具栏中,单击**“执行”**按钮。
向结构中添加聚类分析挖掘模型
然后基于 Microsoft 聚类分析算法向自行车购买者挖掘结构添加挖掘模型。由于聚类分析挖掘模型将使用挖掘结构中定义的所有列,因此,可以不考虑挖掘列的定义,使用快捷方式将模型添加到结构中。
添加聚类分析挖掘模型
在对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。
将
<mining structure name>替换为
Bike Buyer将
<mining model>替换为
Clustering Model删除以下内容:
( [<key column>], <mining model columns>, )将
USING <algorithm name>( <algorithm parameters> )替换为
Using Microsoft_Clustering现在,完整的语句应该如下所示:
ALTER MINING STRUCTURE [Bike Buyer] ADD MINING MODEL [Clustering] USING Microsoft_Clustering在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。
在**“另存为”**对话框中,浏览到适当的文件夹,并将文件命名为 Clustering_Model.dmx。
在工具栏中,单击**“执行”**按钮。
在下一课中,您将处理模型和挖掘结构。