必须先部署 Analysis Services 项目并处理挖掘结构和挖掘模型,然后才能浏览或处理已创建的挖掘模型。
部署 会将项目发送到服务器,并在该服务器上创建该项目中的任何对象。
处理 将关系数据源中的数据加载到 Analysis Services 对象中。
模型在部署和处理之前无法使用。 此外,对模型进行任何更改(例如添加新数据)时,必须重新部署并重新处理模型。
确保与 HoldoutSeed 的一致性
部署项目并处理结构和模型时,数据结构中的单个行会根据数字种子值分配给训练集或测试集。 默认情况下,数字种子值是根据数据结构的属性计算的。 但是,如果你修改模型的某些方面,种子值将会发生变化,从而使结果略有不同。 因此,为了确保您的结果与此处所述相同,我们将任意分配一个固定保留种子值为。 保留种子用于初始化采样算法,并确保数据以大致相同的方式对所有挖掘结构及其模型进行分区。
此值不会影响训练集中的事例数;它只是确保每次生成模型时都会使用相同的分区方法。
有关保留种子的详细信息,请参阅 训练和测试数据集。
设置保留种子
单击 SQL Server Data Tools 中的数据挖掘设计器中的“ 挖掘结构 ”选项卡或 “挖掘模型 ”选项卡。
目标邮件挖掘结构 显示在 “属性 ”窗格中。
按 F4 确保打开“属性”窗格。
确保 CacheMode 被设置为 KeepTrainingCases。
输入
12为 HoldoutSeed。
部署和处理模型
在数据挖掘设计器中,可以根据对模型或基础数据所做的更改范围来确定要处理的对象:
对于此任务,由于数据和模型是新的,因此你将同时处理结构和所有模型。
部署项目并处理所有挖掘模型
在 “挖掘模型 ”菜单中,选择“ 进程挖掘结构”和“所有模型”。
如果对结构进行了更改,系统会提示在处理模型之前生成和部署项目。 单击“是”。
在“处理挖掘结构 - 目标邮件”对话框中单击“运行”。
此时将打开“ 进程进度 ”对话框以显示模型处理的详细信息。 模型处理可能需要一些时间,具体取决于你的计算机。
在模型完成处理后,单击“处理进度”对话框中的“关闭”。
在>”对话框中单击“关闭”。