关联模型的模型内容挖掘(Analysis Services - 数据挖掘)

本主题介绍特定于使用Microsoft关联规则算法的模型的挖掘模型内容。 有关适用于所有模型类型的挖掘模型内容的常规和统计术语的说明,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。

了解关联模型的结构

关联模型具有简单的结构。 每个模型都有一个表示模型及其元数据的父节点,每个父节点都有项集和规则的平面列表。 项目集和规则并非以树形结构组织,它们首先按项目集排序,其次为规则,如下图所示。

关联模型的模型内容结构

每个项集都包含在其自己的节点中(NODE_TYPE = 7)。 该 节点 包括项集的定义、包含此项集的事例数和其他信息。

每个规则也包含在其自己的节点中(NODE_TYPE = 8)。 规则描述了项关联方式的一般模式。 规则类似于 IF-THEN 语句。 规则的左侧显示现有条件或条件集。 规则右侧显示的数据集中的项目通常与左侧的条件相关联。

注意 如果要提取规则或项集,可以使用查询仅返回所需的节点类型。 有关详细信息,请参阅 关联模型查询示例

关联模型的模型内容

本部分仅针对与关联模型相关的挖掘模型内容中的列提供详细信息和示例。

有关架构行集中的常规用途列(如MODEL_CATALOG和MODEL_NAME)的信息,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。

模型目录
存储模型的数据库的名称。

MODEL_NAME
模型的名称。

属性名称
对应于此节点的属性的名称。

NODE_NAME
节点的名称。 对于关联模型,此列包含与NODE_UNIQUE_NAME相同的值。

节点唯一名称
节点的唯一名称。

节点类型
关联模型仅输出以下节点类型:

节点类型 ID 类型
1 (模型) 根节点或父节点。
7 (项目集) 项集或属性值对的集合。 例子:

Product 1 = Existing, Product 2 = Existing



Gender = Male
8 (规则) 一个规则,用于定义项彼此之间的关系。

示例:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing

节点标题
与节点关联的标签或标题。

项集节点 以逗号分隔的项列表。

规则节点 包含规则的左边和右边部分。

儿童基数
指示当前节点的子级数。

父节点 指示项集和规则的总数。

注释

请查看模型根节点的 NODE_DESCRIPTION,以获取项集和规则计数的细分。

项集或规则节点 始终为 0。

父级唯一名称
节点父级的唯一名称。

父节点 始终为 NULL。

项集或规则节点 始终为 0。

节点描述
节点内容的用户友好说明。

父节点 包括有关模型的以下信息的逗号分隔列表:

条目 DESCRIPTION
项目集计数 模型中所有项集的计数。
RULE_COUNT 模型中所有规则的计数。
最小支持 为任何单个项集找到的最小支持度。

注意 此值可能与为 MINIMUM _SUPPORT 参数设置的值不同。
最大支持 为任何单个项集找到的最大支持。

注意 此值可能与为 MAXIMUM_SUPPORT 参数设置的值不同。
最小项目集大小 最小项集的大小,表示为项的数量。

值为 0 表示 Missing 状态被视为独立项。

注意MINIMUM_ITEMSET_SIZE参数的默认值为 1。
MAX_ITEMSET_SIZE(最大项集大小) 指示找到的最大项集的大小。

注意 此值受创建模型时为 MAX_ITEMSET_SIZE 参数设置的值的约束。 此值永远不能超过该值;但是,它可能更少。 默认值为 3。
最低概率 在模型中检测到任何单个项集或规则的最小概率。

示例:0.400390625

注意 对于项集,此值始终大于在创建模型时为 MINIMUM_PROBABILITY 参数设置的值。
最大概率 为模型中的任何单个项集或规则检测到的最大概率。

例如:1

注意 没有参数可限制项集的最大概率。 如果要消除过于频繁的项,请改用 MAXIMUM_SUPPORT 参数。
MIN_LIFT 模型为任何项集提供的最小提升量。

示例:0.14309369632511

注意:了解最小提升有助于确定任何一个项目集的提升是否重要。
MAX_LIFT 模型为任何项集提供的最大提升量。

示例:1.95758227647523 注意 了解最大提升有助于确定任何一个项目集的提升是否重要。

项集节点 项集节点包含项列表,显示为逗号分隔的文本字符串。

示例:

Touring Tire = Existing, Water Bottle = Existing

这意味着一起购买了旅行轮胎和水瓶。

规则节点 规则节点包含规则的左侧和右侧,用箭头分隔。

示例:Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

这意味着,如果有人买了一个旅游轮胎和水瓶,他们也可能买一个自行车帽。

NODE_RULE
描述嵌入在节点中的规则或项集的 XML 片段。

父节点 空白。

项集节点 空白。

规则节点 XML 片段包含有关规则的其他有用信息,例如支持、置信度和项数,以及表示规则左侧的节点的 ID。

边际规则
空白。

节点概率
与项集或规则关联的概率或置信度分数。

父节点 始终为 0。

项集节点 项集的概率。

规则节点 规则的置信度值。

边际概率
与NODE_PROBABILITY相同。

节点分布
该表包含非常不同的信息,具体取决于节点是项集还是规则。

父节点 空白。

项集节点 列出项集中的每个项以及概率和支持值。 例如,如果项集包含两个产品,则会列出每个产品的名称,以及包含每个产品的事例计数。

规则节点 包含两行。 第一行显示规则右侧的属性,即预测项,以及置信度分数。

第二行对关联模型是唯一的;它包含指向规则右侧的项集的指针。 指针在ATTRIBUTE_VALUE列中表示为仅包含右侧项的项集的 ID。

例如,如果规则为 If {A,B} Then {C},则表包含项 {C}的名称,以及包含项 C 项集的节点的 ID。

此指针非常有用,因为你可以从项集节点确定包含右侧产品的所有事例的数量。 受该规则 If {A,B} Then {C} 约束的事例是项集 {C}中列出的事例的子集。

节点支持
支持此节点的事例数。

父节点 模型中的事例数。

项集节点 包含项集中所有项的事例数。

规则节点 包含规则中包含的所有项的事例数。

MSOLAP_MODEL_COLUMN
包含不同的信息,具体取决于节点是项集还是规则。

父节点 空白。

项集节点 空白。

规则节点 包含规则左侧项的项集的 ID。 例如,如果规则为 If {A,B} Then {C},则此列包含仅 {A,B}包含的项集的 ID。

MSOLAP_NODE_SCORE
父节点 空白。

项集节点 项集的重要性分数。

规则节点 规则的重要性分数。

注释

重要性对项集和规则的计算方式不同。 有关详细信息,请参阅 Microsoft关联算法技术参考

MSOLAP_NODE_SHORT_CAPTION
空白。

另请参阅

挖掘模型内容(Analysis Services - 数据挖掘)
Microsoft关联算法
关联模型查询示例