所有挖掘模型都使用相同的结构来存储其内容。 此结构根据数据挖掘内容架构行集定义。 但是,在该标准结构中,包含信息的节点以不同的方式排列,以表示各种树。 本主题介绍节点的组织方式以及每个节点对基于Microsoft时序算法的挖掘模型的含义。
有关适用于所有模型类型的常规挖掘模型内容的说明,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。
查看本主题时,您可能会发现有帮助,通过浏览时序模型的内容进行跟随。 可以通过完成基本数据挖掘教程来创建时序模型。 在本教程中创建的模型是一种混合模型,该模型使用 ARIMA 和 ARTXP 算法训练数据。 有关详细信息,请参阅创建预测结构和模型(中间数据挖掘教程)。 有关如何查看挖掘模型的内容的信息,请参阅 数据挖掘模型查看器。
了解时序模型的结构
时序模型具有表示模型及其元数据的单个父节点。 在该父节点下,有一两个时序树,具体取决于用于创建模型的算法。
如果创建混合模型,则向模型添加两个单独的树,一个用于 ARIMA,另一个用于 ARTXP。 如果选择仅使用 ARTXP 算法或仅使用 ARIMA 算法,则你有一个对应于该算法的树。 可以通过设置FORECAST_METHOD参数来指定要使用的算法。 有关是使用 ARTXP、ARIMA 还是混合模型的详细信息,请参阅 Microsoft时序算法。
下图显示了使用默认设置创建的时序数据挖掘模型示例,用于创建混合模型。 因此,可以更轻松地比较两个模型之间的差异,此处的 ARTXP 模型显示在关系图左侧,ARIMA 模型显示在关系图右侧。 虽然 ARTXP 是一种树状结构,它拆分为更小的分支,但 ARIMA 算法创建的结构更像是从较小的组件向上生成的金字塔。
              
              
            
需要记住的要点是,信息以完全不同的方式排列在 ARIMA 和 ARTXP 树中,应将这两个树视为仅在根节点上相关。 尽管这两种表示形式在一个模型中提供,但为了方便起见,应将其视为两个独立的模型。 ARTXP 表示实际的树结构,但 ARIMA 不。
使用Microsoft通用模型内容树查看器查看使用 ARIMA 和 ARTXP 的模型时,ARTXP 和 ARIMA 模型的节点都显示为父时序模型的子节点。 但是,可以通过应用于节点的标签轻松区分它们。
第一组节点标记为“全部”,并表示 ARTXP 算法的分析结果。
第二组节点标记为 ARIMA,并表示 ARIMA 算法的分析结果。
警告
ARTXP 树上的名称(全部)仅保留以实现向后兼容性。 在 SQL Server 2008 之前,时序算法使用单个算法进行分析,即 ARTXP 算法。
以下各节介绍了节点在每种模型类型中是如何排列的。
ARTXP 模型的结构
ARTXP 算法创建类似于决策树模型的模型。 它会对可预测属性进行分组,并在发现显著差异时拆分它们。 因此,每个 ARTXP 模型都包含每个可预测属性的单独分支。 例如,基本数据挖掘教程创建一个模型,用于预测多个区域的销售额。 在这种情况下, [Amount] 是可预测属性,并且为每个区域创建单独的分支。 如果具有两个可预测属性 [Amount] 和 [Quantity],则会为属性和区域的每个组合创建一个单独的分支。
ARTXP 分支的顶部节点包含决策树根节点中相同的信息。 这包括该节点的子节点数(CHILDREN_CARDINALITY)、满足该节点条件的案例数(NODE_SUPPORT)以及各种描述性统计信息(NODE_DISTRIBUTION)。
如果节点没有任何子节点,这意味着没有发现任何显著条件来证明将这些情况进一步划分为子组是合理的。 分支此时结束,节点称为 叶节点。 叶节点包含 ARTXP 公式构建基块的属性、系数和值。
某些分支可能有其他拆分,类似于决策树模型。 例如,表示欧洲区域的销售额的树分支拆分为两个分支。 当发现导致两个组之间存在显著差异的条件时,将发生拆分。 父节点指示导致拆分的属性的名称,例如 [Amount],以及父节点中有多少个事例。 叶节点提供更多详细信息:属性的值,如 [Sales] >10,000 vs. [Sales] < 10,000)、支持每个条件的事例数和 ARTXP 公式。
注释
如果要查看公式,可以在叶节点级别找到完整的回归公式,但不能在中间节点或根节点中找到。
ARIMA 模型的结构
ARIMA 算法为每个数据系列(如 [区域])和可预测属性(如 [Sales Amount])的每个组合创建一条信息-描述随时间变化的可预测属性的公式。
每个序列的公式派生自多个组件,一个用于数据中找到的每个周期结构。 例如,如果你有每月收集的销售数据,则算法可能会检测每月、季度或每年定期结构。
该算法为每个找到的周期输出一组单独的父节点和子节点。 对于单个时间切片,默认周期为 1,并自动添加到所有模型中。 可以通过在 PERIODICITY_HINT 参数中输入多个值来指定可能的周期结构。 但是,如果算法未检测到定期结构,则不会输出该提示的结果。
模型内容中输出的每个定期结构包含以下组件节点:
自动回归顺序的节点 (AR)
移动平均(MA)的节点
有关这些术语的含义的信息,请参阅 Microsoft时序算法。
差异顺序是公式的重要组成部分,在公式中表示。 有关如何使用差异顺序的详细信息,请参阅 Microsoft时序算法技术参考。
时序的模型内容
本部分仅针对挖掘模型内容中与时序模型具有特定相关性的列提供详细信息和示例。
有关架构行集中的常规用途列的信息(如MODEL_CATALOG和MODEL_NAME),或有关挖掘模型术语的说明,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。
模型目录
存储模型的数据库的名称。
MODEL_NAME
模型的名称。
属性名称
节点中表示的数据系列的可预测属性。 (与MSOLAP_MODEL_COLUMN的值相同。
节点名称
节点的名称。
目前,此列包含与NODE_UNIQUE_NAME相同的值,尽管这可能会在未来版本中更改。
节点_唯一_名称 (NODE_UNIQUE_NAME)
节点的唯一名称。 模型父节点始终命名 为 TS。
ARTXP: 每个节点由 TS 表示,后跟十六进制数值。 节点的顺序不重要。
例如,TS 树下的 ARTXP 节点可能编号为 TS00000001-TS0000000b。
ARIMA: ARIMA 树中的每个节点由 TA 表示,后跟十六进制数值。 子节点包含父节点的唯一名称,后跟另一个十六进制数字,指示节点中的序列。
所有 ARIMA 树的结构完全相同。 每个根都包含下表中所示的节点和命名约定:
| ARIMA 节点 ID 和类型 | 节点名称示例 | 
|---|---|
| ARIMA 根 (27) | TA0000000b | 
| ARIMA 周期结构 (28) | TA00000000b000000000 | 
| ARIMA 自动回归 (29) | TA0000000b000000000 | 
| ARIMA 移动平均值 (30) | TA0000000b000000001 | 
节点类型
时序模型根据算法输出以下节点类型。
ARTXP:
| 节点类型 ID | DESCRIPTION | 
|---|---|
| 1 (模型) | 时序 | 
| 3 (内部) | 表示 ARTXP 时序树中的内部分支。 | 
| 16 (时序树) | 与可预测属性和序列相对应的 ARTXP 树的根。 | 
| 15 (时序) | ARTXP 树中的叶节点。 | 
ARIMA:
| 节点类型 ID | DESCRIPTION | 
|---|---|
| 27 (ARIMA 根) | ARIMA 树的顶部节点。 | 
| 28 (ARIMA 周期结构) | 描述单个周期结构的 ARIMA 树的组件。 | 
| 29 (ARIMA 自动回归) | 包含单个周期结构的系数。 | 
| 30 (ARIMA 移动平均值) | 包含单个周期结构的系数。 | 
节点标题
与节点关联的标签或标题。
此属性主要用于显示目的。
ARTXP: 包含节点的拆分条件,显示为属性和值范围的组合。
ARIMA: 包含 ARIMA 公式的简短形式。
有关 ARIMA 公式的格式的信息,请参阅 ARIMA 的挖掘图例。
儿童基数
节点具有的直接子级数。
父级唯一名称
节点父级的唯一名称。 根级别的任何节点都返回 NULL。
节点描述
当前节点中规则、拆分或公式的文本说明。
ARTXP: 有关详细信息,请参阅 “了解 ARTXP 树”。
ARIMA: 有关详细信息,请参阅 了解 ARIMA 树。
节点规则
当前节点中规则、拆分或公式的 XML 说明。
ARTXP: NODE_RULE通常对应于NODE_CAPTION。
ARIMA: 有关详细信息,请参阅 了解 ARIMA 树。
边际规则
特定于该节点的拆分或内容的 XML 说明。
ARTXP: MARGINAL_RULE通常对应于NODE_DESCRIPTION。
ARIMA: 始终为空;请改用NODE_RULE。
节点概率
              ARTXP: 对于树节点,始终为 1。 对于叶节点,从模型根节点到达节点的概率。
ARIMA: 始终为 0。
边际概率
              ARTXP: 对于树节点,始终为 1。 对于叶节点,从直接父节点到达该节点的概率。
ARIMA: 始终为 0。
节点分布
包含节点概率直方图的表。 在时序模型中,此嵌套表包含组装实际回归公式所需的所有组件。
有关 ARTXP 树中的节点分布表的详细信息,请参阅 “了解 ARTXP 树”。
有关 ARIMA 树中的节点分布表的详细信息,请参阅 “了解 ARIMA 树”。
如果希望看到所有常量和其他组件组成为可读格式,请使用 时序查看器,单击该节点,然后打开 挖掘图例。
节点支持
支持此节点的事例数。
ARTXP: 对于 (All) 节点,指示分支中包含的时间切片总数。
对于终端节点,指示NODE_CAPTION描述的范围中包含的时间切片数。 终端节点中的时间切片数始终与分支 (All) 节点的 NODE_SUPPORT 值求和。
ARIMA: 支持当前周期结构的数据实例计数。 支持值在当前周期结构的所有节点中重复。
MSOLAP_MODEL_COLUMN
节点中表示的数据系列的可预测属性。 (与ATTRIBUTE_NAME的值相同。
MSOLAP节点评分
一个数值,用于描述树或拆分的信息值。
ARTXP: 对于没有拆分的节点,值始终为 0.0。 对于具有拆分的节点,该值表示拆分的有趣分数。
有关评分方法的详细信息,请参阅特征选择(数据挖掘)。
ARIMA: ARIMA 模型的 Bayesian 信息条件 (BIC) 分数。 在与公式相关的所有 ARIMA 节点上设置相同的分数。
MSOLAP_节点短标题
              ARTXP: 与NODE_DESCRIPTION相同的信息。
ARIMA: 与NODE_CAPTION相同的信息:即 ARIMA 公式的短形式。
认识与理解 ARTXP 树
ARTXP 模型清楚地将线性数据区域与按其他因素拆分的数据区域分开。 在可预测属性的更改能够直接表示为独立变量的函数的情况下,计算回归公式以表示这种关系。
例如,如果大多数数据系列的时间和销售之间存在直接关联,则每个序列将包含在一个时序树(NODE_TYPE =16)中,每个数据系列没有子节点,而只包含回归公式。 但是,如果关系不是线性的,ARTXP 时序树可以在条件上拆分为子节点,就像决策树模型一样。 通过查看 Microsoft泛型内容树查看器 中的模型内容,可以查看拆分的发生位置,以及它如何影响趋势线。
若要更好地了解此行为,可以查看在 基本数据挖掘教程中创建的时序模型。 此模型基于 AdventureWorks 数据仓库,不使用特别复杂的数据。 因此,ARTXP 树中没有多少分裂。 但是,即使是这个相对简单的模型也说明了三种不同类型的拆分:
太平洋区域的 [Amount] 趋势线在时间维度上拆分。 时间键的拆分意味着某个时间点的趋势发生了变化。 趋势线仅线性至某个点,然后曲线假定形状不同。 例如,一个时序可能持续到 2002 年 8 月 6 日,另一个时序在该日期之后开始。
北美区域的 [Amount] 趋势线受另一变量影响并出现分裂。 在这种情况下,北美的趋势根据欧洲区域中同一模型的值进行拆分。 换句话说,算法检测到,当欧洲的值发生更改时,北美 A 的值也会更改。
欧洲地区的趋势线发生了自我分裂。
每个拆分意味着什么? 解释模型内容传达的信息是一种艺术,需要深入了解数据及其在业务上下文中的含义。
北美和欧洲地区趋势之间的明显联系可能表明,欧洲的数据系列具有更大的萎缩性,这导致北美的趋势显得较弱。 或者,两者的评分可能没有显著差异,而相关性可能是偶然的,这仅仅是因为先计算了欧洲,再计算北美。 但是,你可能需要查看数据,以确保关联是否为错误的,或进行调查以确定是否有其他因素可能涉及。
时间键的拆分意味着线条的渐变在统计上发生了显著变化。 这可能是由于数学因素的影响,例如对每个范围的支持或进行拆分所需的熵计算。 因此,在模型在现实世界中的含义方面,这种拆分可能并不有趣。 但是,在查看拆分中指示的时间段时,你可能会发现数据中未表示的有趣关联,例如当时开始的销售促销或其他事件,并且可能会影响数据。
如果数据包含其他属性,则很可能在树中看到更有趣的分支示例。 例如,如果跟踪天气信息并将其用作分析属性,则可能在表示销售和天气的复杂交互的树中看到多个拆分。
简言之,数据挖掘可用于提供有关潜在有趣现象发生位置的提示,但需要进一步调查和业务用户的专业知识来准确解释上下文中信息的价值。
ARTXP 时序公式的元素
若要查看 ARTXP 树或分支的完整公式,建议使用Microsoft时序查看器的挖掘图例,该图例以可读格式呈现所有常量。
以下部分提供了一个示例公式并说明了基本术语。
ARTXP 公式的挖掘图例
以下示例展示了模型某部分的 ARTXP 公式,显示在 挖掘图例中。 若要查看此公式,请打开在 Microsoft 时序查看器的“基本数据挖掘教程”中创建的 [Forecasting] 模型,单击“ 模型 ”选项卡,然后选择 R250:Europe 数据系列树。
若要查看此示例使用的公式,请单击表示 2003 年 7 月 5 日或之后日期序列的节点。
树节点公式示例:
Quantity = 21.322
-0.293 * Quantity(R250 North America,-7) + 0.069 * Quantity(R250 Europe,-1) + 0.023 *
Quantity(R250 欧洲, -3) -0.142 * Quantity(R750 欧洲, -8)
在这种情况下,值 21.322 表示作为以下公式元素函数预测的 Quantity 值。
例如,一个元素是 Quantity(R250 North America,-7)。 此表示法表示北美区域在当前时间切片之前为 t-7 或 7 个时间切片的数量。 此数据系列的值乘以系数 -0.293。 每个元素的系数在训练过程中派生,并基于数据的趋势。
此公式中有多个元素,因为该模型已计算出欧洲区域中 R250 模型的数量取决于其他几个数据系列的值。
ARTXP 公式的模型内容
下表显示了公式的相同信息,使用Microsoft 泛型内容树查看器(数据挖掘)中显示的相关节点的内容。
| 属性名称 | 属性值 | Support | 概率 | 方差 | 值类型 | 
|---|---|---|---|---|---|
| 数量(R250 欧洲,y轴截距) | 21.3223433563772 | 11 | 0 | 1.65508795539661 | 11 (截距) | 
| Quantity(R250 Europe,-1) | 0.0691694140876526 | 0 | 0 | 0 | 7 (系数) | 
| 数量(R250 欧洲,-1) | 20.6363635858123 | 0 | 0 | 182.380682874818 | 9 (统计信息) | 
| 数量(R750 欧洲,-8) | -0.1421203048299 | 0 | 0 | 0 | 7 (系数) | 
| 数量(R750 欧洲,-8) | 22.5454545333019 | 0 | 0 | 104.362130048408 | 9 (统计信息) | 
| 数量(R250 Europe,-3) | 0.0234095979448281 | 0 | 0 | 0 | 7 (系数) | 
| Quantity(R250 Europe,-3) | 24.8181818883176 | 0 | 0 | 176.475304989169 | 9 (统计信息) | 
| 数量(R250 北美,-7) | -0.292914186039869 | 0 | 0 | 0 | 7 (系数) | 
| 数量(R250 北美,-7) | 10.36363640433 | 0 | 0 | 701.882534898676 | 9 (统计信息) | 
从比较这些示例中可以看到,挖掘模型内容包含挖掘图例中可用的相同信息,但另外添加了表示方差和支持的列。 支持值指示符合此公式趋势的案例数量。
使用 ARTXP 时序公式
对于大多数业务用户来说,ARTXP 模型内容的价值在于它结合了树视图和数据线性表示形式。
如果可预测属性的更改可以表示为独立变量的线性函数,该算法将自动计算独立节点中的回归公式和输出该序列
每当关系不能表示为线性关联时,时序分支会像决策树一样。
通过浏览 Microsoft时序查看器 中的模型内容,可以看到拆分的位置以及它如何影响趋势线。
如果数据系列的任何部分的时间和销售之间存在直接关联,获取公式的最简单方法是从 挖掘图例复制公式,然后将其粘贴到文档或演示文稿中,以帮助解释模型。 或者,可以从该树的NODE_DISTRIBUTION表中提取平均值、系数和其他信息,并将其用于计算趋势的扩展。 如果整个系列表现出一致的线性关系,公式将包含在 (All) 节点中。 如果树中有任何分支,则公式包含在叶节点中。
以下查询返回挖掘模型中的所有 ARTXP 叶节点,以及包含公式的嵌套表NODE_DISTRIBUTION。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,  
NODE_CAPTION,   
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE  
FROM NODE_DISTRIBUTION) as t  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 15  
对 ARIMA 树的了解
ARIMA 模型中的每个结构都对应于 周期 性或 周期性结构。 定期结构是在整个数据系列中重复的数据模式。 在统计限制内,允许模式中的一些细微变化。 周期根据训练数据中使用的默认时间单位进行度量。 例如,如果训练数据每天提供销售数据,则默认时间单位为一天,并且所有定期结构都定义为指定的天数。
算法检测到的每个周期都将得到它自己的结构节点。 例如,如果要分析每日销售数据,模型可能会检测表示周的定期结构。 在这种情况下,该算法将在完成的模型中创建两个周期结构:一个用于默认的每日周期,表示为 {1},一个为星期,由它 {7}指示。
例如,以下查询从挖掘模型返回所有 ARIMA 结构。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 27  
示例结果:
| MODEL_NAME | 属性名称 | 节点名称 | 节点类型 | 节点标题 | 
|---|---|---|---|---|
| 预测 | M200 Europe:Quantity | TA00000000 | 二十七 | ARIMA (1,0,1) | 
| 预测 | M200 北美:数量 | TA00000001 | 二十七 | ARIMA (1,0,4) X (1,1,4)(6) | 
| 预测 | M200 Pacific:数量 | TA00000002 | 二十七 | ARIMA (2,0,8) X (1,0,0)(4) | 
| 预测 | M200 Pacific:数量 | TA00000002 | 二十七 | ARIMA (2,0,8) X (1,0,0)(4) | 
| 预测 | R250 Europe:数量 | TA00000003 | 二十七 | ARIMA (1,0,7) | 
| 预测 | R250 北美:数量 | TA00000004 | 二十七 | ARIMA (1,0,2) | 
| 预测 | R250 Pacific:数量 | TA00000005 | 二十七 | ARIMA (2,0,2) X (1,1,2)(12) | 
| 预测 | R750 欧洲:数量 | TA00000006 | 二十七 | ARIMA (2,1,1) X (1,1,5)(6) | 
| 预测 | T1000 欧洲:数量 | TA00000009 | 二十七 | ARIMA (1,0,1) | 
| 预测 | T1000 北美:数量 | TA0000000a | 二十七 | ARIMA (1,1,1) | 
| 预测 | T1'000 Pacific,数量 | TA0000000b | 二十七 | ARIMA (1,0,3) | 
从这些结果(也可以使用 Microsoft泛型内容树查看器(数据挖掘)进行浏览,你可以一目了然地了解哪些系列是完全线性的、具有多个周期结构以及发现的周期是什么。
例如,M200 欧洲系列的 ARIMA 公式的简短形式会告诉你只检测到默认周期或每日周期。 公式的短形式在NODE_CAPTION列中提供。
然而,对于 M200 北美系列,发现了一个额外的周期结构。 节点TA00000001有两个子节点,一个具有公式(1,0,4),一个具有公式(1,1,4)(6)。 这些公式是串联的,并在父节点中显示。
对于每个周期结构,模型内容还提供 顺序 和 移动平均值 作为子节点。 例如,以下查询检索上一示例中所列节点之一的子节点。 请注意,列PARENT_UNIQUE_NAME必须括在括号中,才能将其与同名的保留关键字区分开来。
SELECT *   
FROM Forecasting.CONTENT  
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'  
由于这是 ARIMA 树,而不是 ARTXP 树,因此不能使用 IsDescendant (DMX) 函数返回此周期结构的子节点。 相反,可以使用属性和节点类型筛选结果并返回子节点,这些子节点提供有关公式的生成方式的详细信息,包括移动平均值和差异顺序。
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,  
NODE_TYPE,  NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'  
AND (NODE_TYPE = 29 or NODE_TYPE = 30)  
示例结果:
| MODEL_NAME | 属性名称 | 节点_唯一_名称 (NODE_UNIQUE_NAME) | 节点类型 | 节点标题 | 
|---|---|---|---|---|
| 预测 | M200 北美:数量 | TA00000001000000010 | 二十九 | ARIMA {1,0.961832044807041} | 
| 预测 | M200 北美:数量 | TA00000001000000011 | 30 | ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.22031434327742,-1.33151478258758} | 
| 预测 | M200 北美:数量 | TA00000001000000000 | 二十九 | ARIMA {1,0.643565911081657} | 
| 预测 | M200 北美:数量 | TA00000001000000001 | 30 | ARIMA {1,1.45035399809581E-02,-4.40489283927752E-02,-0.19203901352577,0.242202497643993} | 
这些示例说明,当您深入 ARIMA 树时,会显示更多详细信息,同时重要信息也会在父节点中合并并呈现。
ARIMA 时序模型公式
若要查看任何 ARIMA 节点的完整公式,建议使用Microsoft时序查看器的挖掘图例,该图例显示自动回归顺序、移动平均值和公式的其他元素,这些元素已以一致格式构成。
本部分提供了一个示例公式并说明了基本术语。
ARIMA 公式的挖掘图例
以下示例显示了模型的一部分的 ARIMA 公式,如挖掘图例中所示。 若要查看此公式,请使用Microsoft时序查看器打开预测模型,单击“模型”选项卡,选择 R250:欧洲数据系列树,然后单击表示 2003 年 7 月 5 日或之后日期序列的节点。 矿业传说以可读格式编写所有常量,如下例所示:
ARIMA 公式:
ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.88887303034670339,-5.05429403071953E--02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.888888888888888899
此公式是长 ARIMA 格式,其中包括系数和截距的值。 此公式的短格式为 {1,0,7},其中 1 表示时间段为时间切片计数,0 表示术语差顺序,7 表示系数数。
注释
常量由 Analysis Services 计算方差,但该常量本身不会显示在用户界面中的任何位置。 但是,如果在图表视图中选择“显示偏差”,则可以将序列中任意点的方差视为此常量函数。 每个数据系列的工具提示显示特定预测点的方差。
ARIMA 公式的模型内容
ARIMA 模型遵循标准结构,其中包含不同类型的节点中包含的不同信息。 若要查看 ARIMA 模型的模型内容,请将查看器更改为 Microsoft泛型内容树查看器,然后展开具有属性名称 R250 Europe: Quantity 的节点。
数据系列的 ARIMA 模型包含四种不同格式的基本周期公式,可以根据应用程序进行选择。
NODE_CAPTION: 显示公式的短格式。 短格式告诉你表示了多少个周期结构,以及它们具有多少个系数。 例如,如果公式的短格式为 {4,0,6},则节点表示具有 6 个系数的一个周期结构。 如果短格式类似于 {2,0,8} x {1,0,0}(4),则节点包含两个周期结构。
节点说明: 显示公式的长格式,这也是 在挖掘图例中显示的公式的形式。 公式的长形式类似于短形式,只是显示系数的实际值而不是计数。
NODE_RULE: 显示公式的 XML 表示形式。 根据节点类型,XML 表示形式可以包含单个或多个定期结构。 下表说明了 XML 节点如何汇总到 ARIMA 模型的较高级别。
| 节点类型 | XML 内容 | 
|---|---|
| 27 (ARIMA 根) | 包括数据系列的所有周期结构,以及每个周期结构的所有子节点的内容。 | 
| 28 (ARIMA 周期结构) | 定义单个周期结构,包括其自回归项节点及其移动平均系数。 | 
| 29 (ARIMA 自动回归) | 列出单个周期性结构的相关术语。 | 
| 30 (ARIMA 移动平均值) | 列出单个周期结构的系数。 | 
NODE_DISTRIBUTION: 在嵌套表中显示公式的术语,可以查询以获取特定术语。 节点分布表遵循与 XML 规则相同的分层结构。 也就是说,ARIMA 系列(NODE_TYPE = 27)的根节点包含截距值和完整公式的周期性,其中包括多个周期性,而子节点仅包含特定于特定周期结构或该周期结构的子节点的信息。
| 节点类型 | 特征 | 值类型 | 
|---|---|---|
| 27 (ARIMA 根) | 拦截 周期  | 
11 | 
| 28 (ARIMA 周期结构) | 周期 自动回归顺序 差异顺序 移动平均序列  | 
12 13 15 14  | 
| 29 (ARIMA 自动回归) | 系数 (系数的补充)  | 
7 | 
| 30 (ARIMA 移动平均值) | t时的值 t-1 处的值 ... t-n 处的值  | 
7 | 
移动平均顺序的值指示序列中移动平均值的数量。 一般情况下,如果序列中有 n 个词,则移动平均值计算 n-1 次,但可以减少该数字,以便于计算。
自动回归顺序的值指示自动回归序列的数目。
差异顺序的值指示序列的比较次数或差异次数。
有关可能的值类型的枚举,请参阅 Microsoft.AnalysisServices.AdomdServer.MiningValueType。
使用 ARIMA 树信息
如果使用基于业务解决方案中的 ARIMA 算法的预测,则可能需要将公式粘贴到报表中,以演示用于创建预测的方法。 可以使用标题以短格式显示公式,也可以使用说明以长格式显示公式。
如果你正在开发使用时序预测的应用程序,你可能会发现从模型内容获取 ARIMA 公式,然后进行自己的预测会很有用。 若要获取任何特定输出的 ARIMA 公式,可以直接查询该特定属性的 ARIMA 根,如前面的示例所示。
如果知道包含所需序列的节点的 ID,可以使用两个选项来检索公式的组件:
嵌套表格式:使用 DMX 查询或通过 OLEDB 客户端进行查询。
XML 表示形式:使用 XML 查询。
注解
从 ARTXP 树中检索信息可能很困难,因为每个拆分的信息位于树中的不同位置。 因此,使用 ARTXP 模型时,必须获取所有部分,然后执行一些处理以重建完整的公式。 从 ARIMA 模型检索公式更容易,因为该公式在整个树中都可用。 有关如何创建查询以检索此信息的信息,请参阅 时序模型查询示例。
另请参阅
              挖掘模型内容(Analysis Services - 数据挖掘)
              Microsoft时序算法
              时序模型查询示例
              Microsoft时序算法技术参考