在目标邮件结构中处理模型 (基本数据挖掘教程)

必须先部署 Analysis Services 项目并处理挖掘结构和挖掘模型,然后才能浏览或处理已创建的挖掘模型。

  • 部署 会将项目发送到服务器,并在该服务器上创建该项目中的任何对象。

  • 处理 将关系数据源中的数据加载到 Analysis Services 对象中。

模型在部署和处理之前无法使用。 此外,对模型进行任何更改(例如添加新数据)时,必须重新部署并重新处理模型。

确保与 HoldoutSeed 的一致性

部署项目并处理结构和模型时,数据结构中的单个行会根据数字种子值分配给训练集或测试集。 默认情况下,数字种子值是根据数据结构的属性计算的。 但是,如果你修改模型的某些方面,种子值将会发生变化,从而使结果略有不同。 因此,为了确保您的结果与此处所述相同,我们将任意分配一个固定保留种子值为。 保留种子用于初始化采样算法,并确保数据以大致相同的方式对所有挖掘结构及其模型进行分区。

此值不会影响训练集中的事例数;它只是确保每次生成模型时都会使用相同的分区方法。

有关保留种子的详细信息,请参阅 训练和测试数据集

设置保留种子

  1. 单击 SQL Server Data Tools 中的数据挖掘设计器中的“ 挖掘结构 ”选项卡或 “挖掘模型 ”选项卡。

    目标邮件挖掘结构 显示在 “属性 ”窗格中。

  2. F4 确保打开“属性”窗格。

  3. 确保 CacheMode 被设置为 KeepTrainingCases

  4. 输入 12HoldoutSeed

部署和处理模型

在数据挖掘设计器中,可以根据对模型或基础数据所做的更改范围来确定要处理的对象:

对于此任务,由于数据和模型是新的,因此你将同时处理结构和所有模型。

部署项目并处理所有挖掘模型

  1. “挖掘模型 ”菜单中,选择“ 进程挖掘结构”和“所有模型”。

    如果对结构进行了更改,系统会提示在处理模型之前生成和部署项目。 单击“是”

  2. “处理挖掘结构 - 目标邮件”对话框中单击“运行”

    此时将打开“ 进程进度 ”对话框以显示模型处理的详细信息。 模型处理可能需要一些时间,具体取决于你的计算机。

  3. 在模型完成处理后,单击“处理进度”对话框中的“关闭”。

  4. 在>”对话框中单击“关闭”。

课程中的上一个任务

将新模型添加到目标邮件结构(基本数据挖掘教程)

下一课

第 4 课:探索目标邮件模型(基本数据挖掘教程)

另请参阅

处理要求和注意事项 (数据挖掘)