在数据挖掘向导的最后几个屏幕中,你将数据拆分为测试集和训练集。 然后,你将为结构命名,并在模型上启用钻取。
指定测试集
在创建挖掘结构时将数据拆分为训练集和测试集,可以轻松地评估稍后创建的挖掘模型的准确性。 有关测试集的详细信息,请参阅 训练和测试数据集。
指定测试集
在“ 创建测试集 ”页上,对于 要测试的数据百分比,保留默认值
30。对于 测试数据集中的最大事例数,请键入
1000。单击 “下一步” 。
指定钻取
可以在模型和结构上启用钻取。 此对话框中的复选框可以启用命名模型的钻取功能。 处理模型后,将能够从用于创建模型的训练数据中检索详细信息。
如果基础挖掘结构已配置为允许钻取,则可以从模型案例和挖掘结构中检索详细信息,包括挖掘模型中未包含的列。 有关详细信息,请参阅钻取查询(数据挖掘)。
命名模型和结构并指定钻取
在 “完成向导” 页上的 “挖掘结构名称”中,键入
Targeted Mailing。在 挖掘模型名称中,键入
TM_Decision_Tree。选中“ 允许钻取 ”复选框。
查看 “预览 ”窗格。 注意,只有选择为关键、输入或可预测的列才会显示。 所选的其他列(例如 AddressLine1)不用于生成模型,但在基础结构中可用,可以在处理和部署模型后进行查询。
单击“完成”。