探索 Naive Bayes 模型(基本数据挖掘教程)

Microsoft Naive Bayes 算法提供了几种方法来显示自行车购买与输入属性之间的交互。

Microsoft Naive Bayes 查看器提供了以下选项卡用于探索 Naive Bayes 挖掘模型:

依赖关系网络

依赖项网络 ”选项卡的工作方式与Microsoft树查看器的 “依赖项网络 ”选项卡相同。 查看器中的每个节点表示一个属性,节点之间的行表示关系。 在查看器中,可以看到影响可预测属性状态的所有属性,即 Bike Buyer。

在“依赖关系网络”选项卡中探索模型

  1. 使用挖掘模型查看器选项卡顶部的挖掘模型列表切换到TM_NaiveBayes模型。

  2. 使用 查看器 列表切换到 Microsoft Naive Bayes Viewer

  3. Bike Buyer单击节点以标识其依赖项。

    粉红色底纹表示所有属性都对自行车购买产生影响。

  4. 调整滑块以识别最具影响力的属性。

    当你降低滑块时,只会保留对 [Bike Buyer] 列产生最大影响的属性。 通过调整滑块,可以发现一些最具影响力的属性是:拥有的汽车数量、通勤距离和儿童总数。

属性档案

属性配置文件 ”选项卡描述输入属性的不同状态如何影响可预测属性的结果。

在“属性配置文件”选项卡中探索模型

  1. 在“可预测”框中,确认已选择Bike Buyer

  2. 如果挖掘图例阻碍了属性配置文件的显示,请将它移开。

  3. 直方图 条框中,选择 5

    在我们的模型中,5 是任意一个变量的最大状态数。

    影响此可预测属性状态的属性与输入属性的每个状态的值及其分布在可预测属性的每个状态一起列出。

  4. “属性” 列中,找到 拥有汽车的数量。 请注意,标记为1的栏为自行车购买者的直方图,而标记为0的栏为非买家的直方图。 拥有零辆或一辆车的人更有可能去买自行车。

  5. 双击在标记为第 1 列的自行车购买者列中的 “拥有的车辆数” 单元格。

    Mining Legend显示了更详细的视图。

属性特征

使用 “属性特征 ”选项卡,可以选择属性和值,以查看其他属性的值在所选值事例中的显示频率。

在“属性特征”选项卡中探索模型

  1. “属性” 列表中,验证是否已 Bike Buyer 选中。

  2. 设置为 1

    在查看器中,你将看到在家没有孩子、短通勤和住在北美地区的客户更有可能购买自行车。

属性歧视

使用 “属性歧视 ”选项卡,可以调查自行车购买和其他属性值的两个离散值之间的关系。 TM_NaiveBayes由于模型只有两种状态(1 和 0),因此无需对查看器进行任何更改。

在观众中,可以看到那些不拥有汽车的人倾向于购买自行车,拥有两辆车的人往往不买自行车。

请参阅以下主题,了解其他挖掘模型。

下一课

第 5 课:测试模型(基本数据挖掘教程)

课程中的上一个任务

探索聚类分析模型(基本数据挖掘教程)

另请参阅

使用 Microsoft Naive Bayes 查看器浏览模型
属性区分选项卡(挖掘模型查看器)
属性配置文件选项卡 (挖掘模型查看器)
属性特征选项卡 (挖掘模型查看器)
依赖关系网络选项卡 (挖掘模型查看器)