在模型中指定用作回归器的列

线性回归模型表示可预测属性的值作为公式的结果,该公式将输入组合在一起,使数据尽可能接近于估计回归线。 该算法仅接受数值作为输入,并自动检测最适合的输入。

要把某一列指定为回归器以包含在模型中,可以通过添加 FORCE_REGRESSOR 参数并指定要使用的回归器来实现。 在属性的效果过小,无法被模型检测到时,或者当你想确保该属性包括在公式中时,你可能会想要这样做。

以下过程介绍如何使用用于 神经网络教程的相同示例数据创建简单的线性回归模型。 模型不一定可靠,但演示如何使用数据挖掘设计器自定义线性回归模型。

如何创建简单的线性回归模型

  1. 在 SQL Server Data Tools (SSDT) 的解决方案资源管理器中,展开 挖掘结构

  2. 双击“Call Center.dmm”以在设计器中打开。

  3. “挖掘模型 ”菜单中,选择“ 新建挖掘模型”。

  4. 对于算法,请选择 Microsoft线性回归。 对于名称,请键入 呼叫中心回归

  5. “挖掘模型 ”选项卡中,按如下所示更改列使用情况。 所有不在以下列表中的列,如果尚未设置,则应设置为忽略

    FactCallCenterID密钥

    ServiceGradePredictOnly

    运算符输入总数

    每个问题的平均时间输入

  6. “挖掘模型 ”菜单中,选择“ 设置模型参数”。

  7. 对于参数,FORCE_REGRESSOR,在 “值 ”列中,键入括在括号中的列名称,用逗号分隔,如下所示:

    [Average Time Per Issue],[Total Operators]  
    

    注释

    该算法将自动检测哪些列是最佳回归器。 仅当想要确保列包含在最终公式中时,才需要强制回归器。

  8. “挖掘模型 ”菜单中,选择“ 进程模型”。

    在查看器中,模型表示包含回归公式的单个节点。 可以在 挖掘图例中查看公式,也可以使用查询提取公式的系数。

另请参阅

Microsoft线性回归算法
数据挖掘查询
Microsoft线性回归算法技术参考
线性回归模型的模型内容挖掘(Analysis Services - 数据挖掘)