在本课中,你将向刚刚在第 1 课中创建的挖掘结构添加新的挖掘模型 :创建时序挖掘模型和挖掘结构。
修改数据挖掘结构语句
若要向现有挖掘结构添加新的挖掘模型,请使用 ALTER MINING STRUCTURE (DMX) 语句。 语句中的代码可以分为以下部分:
确定挖掘结构
命名挖掘模型
定义关键列
定义可预测列
指定算法和任何参数更改
下面是 ALTER MINING STRUCTURE 语句的通用示例:
ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
([<key columns>],
<mining model columns>
)
USING <algorithm name>([<algorithm parameters>])
[WITH DRILLTHROUGH]
代码的第一行识别现有的挖掘结构,以便添加挖掘模型。
ALTER MINING STRUCTURE [<mining structure name>]
代码的下一行将为即将添加到挖掘结构的挖掘模型命名:
ADD MINING MODEL [<mining model name>]
有关在 DMX 中命名对象的信息,请参阅标识符(DMX)。
后续代码行定义挖掘结构中将由挖掘模型使用的列。
[<key columns>],
<mining model columns>
只能使用挖掘结构中已存在的列,列表中的第一列必须是挖掘结构中的键列。
代码的下一行定义挖掘算法,该算法生成挖掘模型和可在算法上设置的算法参数,并指定是否可以从挖掘模型向下钻取到训练事例中的详细数据:
USING <algorithm name>([<algorithm parameters>])
WITH DRILLTHROUGH
有关可以调整的算法参数的详细信息,请参阅 Microsoft时序算法技术参考。
可以使用以下语法指定挖掘模型中的列用于预测:
<mining model column> PREDICT
课程任务
在本课中,你将执行以下任务:
向结构添加新的时序挖掘模型。
更改算法参数以使用不同的分析和预测方法
将 ARIMA 时序模型添加到结构
第一步是向现有结构添加新的预测挖掘模型。 默认情况下,Microsoft时序算法使用两种算法(ARIMA 和 ARTXP)创建时序挖掘模型,并混合结果。 但是,可以指定要使用的单个算法,也可以指定算法的确切混合。 在此步骤中,将添加仅使用 ARIMA 算法的新模型。 此算法针对长期预测进行优化。
添加 ARIMA 时序挖掘模型
在 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 DMX 打开查询编辑器和新的空白查询。
将 ALTER MINING STRUCTURE 语句的泛型示例复制到空白查询中。
替换以下内容:
<mining structure name>替换为:
[Forecasting_MIXED_Structure]替换以下内容:
<mining model name>替换为:
Forecasting_ARIMA替换以下内容:
<key columns>,替换为:
[ReportingDate], [ModelRegion]请注意,无需重复在 CREATE MINING MODEL 语句中提供的任何日期类型或内容类型信息,因为此信息已存储在挖掘结构中。
替换以下内容:
<mining model columns>替换为:
([Quantity] PREDICT, [Amount] PREDICT )替换以下内容:
USING <algorithm name>([<algorithm parameters>]) [WITH DRILLTHROUGH]替换为:
USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = .08, FORECAST_METHOD = 'ARIMA') WITH DRILLTHROUGH生成的语句现在应如下所示:
ALTER MINING STRUCTURE [Forecasting_MIXED_Structure] ADD MINING MODEL [Forecasting_ARIMA] ( ([ReportingDate], [ModelRegion], ([Quantity] PREDICT, [Amount] PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = .08, FORECAST_METHOD = 'ARIMA') WITH DRILLTHROUGH在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件
Forecasting_ARIMA.dmx。在工具栏上,单击“ 执行 ”按钮。
将 ARTXP 时序模型添加到结构
ARTXP 算法是 SQL Server 2005 中的默认时序算法,并针对短期预测进行优化。 若要使用这三种时序算法比较预测,需要添加一个基于 ARTXP 算法的模型。
添加 ARTXP 时序挖掘模型
将以下代码复制到空白查询窗口中。
请注意,除了新挖掘模型的名称和FORECAST_METHOD参数的值之外,无需更改任何内容。
ALTER MINING STRUCTURE [Forecasting_MIXED_Structure] ADD MINING MODEL [Forecasting_ARTXP] ( ([ReportingDate], [ModelRegion], ([Quantity] PREDICT, [Amount] PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = .08, FORECAST_METHOD = 'ARTXP') WITH DRILLTHROUGH在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件
Forecasting_ARTXP.dmx。在工具栏上,单击“ 执行 ”按钮。
在下一课中,你将处理所有模型和挖掘结构。