线性回归模型表示可预测属性的值作为公式的结果,该公式将输入组合在一起,使数据尽可能接近于估计回归线。 该算法仅接受数值作为输入,并自动检测最适合的输入。
要把某一列指定为回归器以包含在模型中,可以通过添加 FORCE_REGRESSOR 参数并指定要使用的回归器来实现。 在属性的效果过小,无法被模型检测到时,或者当你想确保该属性包括在公式中时,你可能会想要这样做。
以下过程介绍如何使用用于 神经网络教程的相同示例数据创建简单的线性回归模型。 模型不一定可靠,但演示如何使用数据挖掘设计器自定义线性回归模型。
如何创建简单的线性回归模型
在 SQL Server Data Tools (SSDT) 的解决方案资源管理器中,展开 挖掘结构。
双击“Call Center.dmm”以在设计器中打开。
从 “挖掘模型 ”菜单中,选择“ 新建挖掘模型”。
对于算法,请选择 Microsoft线性回归。 对于名称,请键入 呼叫中心回归。
在 “挖掘模型 ”选项卡中,按如下所示更改列使用情况。 所有不在以下列表中的列,如果尚未设置,则应设置为忽略。
FactCallCenterID密钥
ServiceGradePredictOnly
运算符输入总数
每个问题的平均时间输入
在 “挖掘模型 ”菜单中,选择“ 设置模型参数”。
对于参数,FORCE_REGRESSOR,在 “值 ”列中,键入括在括号中的列名称,用逗号分隔,如下所示:
[Average Time Per Issue],[Total Operators]注释
该算法将自动检测哪些列是最佳回归器。 仅当想要确保列包含在最终公式中时,才需要强制回归器。
从 “挖掘模型 ”菜单中,选择“ 进程模型”。
在查看器中,模型表示包含回归公式的单个节点。 可以在 挖掘图例中查看公式,也可以使用查询提取公式的系数。
另请参阅
Microsoft线性回归算法
数据挖掘查询
Microsoft线性回归算法技术参考
线性回归模型的模型内容挖掘(Analysis Services - 数据挖掘)