更新日期: 2007 年 9 月 15 日
在本课中,您将创建一个挖掘结构,使用该结构,可以预测 Adventure Works Cycles 的潜在客户是否能购买自行车。 如果您不熟悉挖掘结构及其在数据挖掘中的作用,请参阅挖掘结构 (Analysis Services)。
您将在本课中创建的自行车购买者挖掘结构支持根据 Microsoft 决策树算法和 Microsoft 聚类分析算法添加挖掘模型。 在后面的课程中,您将使用聚类分析挖掘模型来浏览各种客户分组方式,并使用决策树挖掘模型来预测潜在的客户是否将购买自行车。
CREATE MINING STRUCTURE 语句
为了创建一个挖掘结构,可以使用 CREATE MINING STRUCTURE (DMX) 语句。 可以将语句中的代码分为下列几部分:
- 命名结构
- 定义键列
- 定义挖掘列
下面是 CREATE MINING STRUCTURE 语句的一般示例:
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
代码的第一行定义了结构的名称:
CREATE MINING STRUCTURE [<mining structure name>]
有关在 DMX 中命名对象的信息,请参阅标识符 (DMX)。
代码的下一行定义了挖掘结构的键列,它唯一标识源数据中的实体:
<key column>,
在此挖掘结构中,客户标识符 (CustomerKey) 定义了源数据中的实体。
代码的最后一行用于定义将由与挖掘结构关联的挖掘模型所使用的挖掘列:
<mining structure columns>
可以在 <挖掘结构列> 中使用 DISCRETIZE 函数将连续列中的值更改为一系列离散值,如以下语法所示:
DISCRETIZE(<method>,<number of buckets>)
有关离散化列的详细信息,请参阅离散化方法。 有关您可以定义的挖掘结构列类型的详细信息,请参阅挖掘结构列。
课程任务
在本课中,您将执行以下任务:
- 创建新的空白查询
- 更改查询以创建挖掘结构
- 执行查询
创建查询
第一步是连接到 Analysis Services 实例,并在 SQL Server Management Studio 中创建一个新的 DMX 查询。
在 SQL Server Management Studio 中创建一个新的 DMX 查询
打开 SQL Server Management Studio。
在**“连接到服务器”对话框中,针对“服务器类型”,选择 Analysis Services。 在“服务器名称”中,键入 LocalHost,或键入在本课中要连接到的 Analysis Services 实例的名称。 单击“连接”**。
在对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
更改查询
第二步是修改上述 CREATE MINING STRUCTURE 语句以创建自行车购买者挖掘结构。
自定义 CREATE MINING STRUCTURE 语句
在查询编辑器中,将 CREATE MINING STRUCTURE 语句的一般示例复制到空白查询中。
将
[<mining structure>]替换为
[Bike Buyer]将
<key column>替换为
CustomerKey LONG KEY将
<mining structure columns>替换为
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS现在,完整的挖掘结构语句应该如下所示:
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS )在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。
在**“另存为”**对话框中,找到相应的文件夹,然后将文件命名为 Bike Buyer Structure.dmx。
执行查询
最后一步是执行查询。 创建并保存查询后,必须运行查询中的语句以在服务器中创建挖掘结构。 有关在查询编辑器中执行查询的详细信息,请参阅 SQL Server Management Studio Transact SQL 查询。
执行查询
在查询编辑器中,单击工具栏中的**“执行”**。
执行完语句后,将在查询编辑器底部的**“消息”**选项卡中显示查询状态。 所显示的消息应为:
Executing the query Execution complete现在,服务器中便有了名为**“自行车购买者”**的新结构。
在下一课中,您将向刚才创建的结构中添加挖掘模型。