在此任务中,将添加一个数据源视图,该视图将用于访问呼叫中心数据。 相同的数据将用于生成用于探索的初始神经网络模型,以及用于提出建议的逻辑回归模型。
你还将使用数据源视图设计器为一周中的某一天添加列。 这是因为,虽然源数据按日期跟踪呼叫中心数据,但你的体验会告诉你,通话量和服务质量都有定期模式,具体取决于当天是周末还是工作日。
过程
添加数据源视图
在 解决方案资源管理器中,右键单击 “数据源视图”,然后选择“ 新建数据源视图”。
此时会打开“数据源视图向导”。
在 “欢迎使用数据源视图向导” 页上,单击“ 下一步”。
在 “选择数据源”页中,选择 关系型数据源下的 Adventure Works DW 多维 2012 数据源。 如果没有此数据源,请参阅 基本数据挖掘教程。 单击 “下一步” 。
在“ 选择表和视图 ”页上,选择下表,然后单击右箭头将其添加到数据源视图:
FactCallCenter (dbo)
DimDate
单击 “下一步” 。
在 “完成向导” 页上,默认情况下,数据源视图名为 Adventure Works DW 多维 2012。 将名称更改为 CallCenter,然后单击“ 完成”。
将打开数据源视图设计器以显示 CallCenter 数据源视图。
在“数据源视图”窗格中右键单击,然后选择“ 添加/删除表”。 选择该表 ,DimDate 并单击“ 确定”。
应在每个表中的
DateKey列之间自动添加关系。 你将使用此关系从 DimDate 表获取列 EnglishDayNameOfWeek,并在模型中使用它。在数据源视图设计器中,右键单击表 FactCallCenter,然后选择“ 新建命名计算”。
在“ 创建命名计算 ”对话框中,键入以下值:
列名 DayOfWeek 说明 从 DimDate 表中获取星期几 表达式 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)若要验证表达式是否创建了所需的数据,请右键单击表 FactCallCenter,然后选择“ 浏览数据”。
花一分钟时间查看可用的数据,以便了解它在数据挖掘中的用法:
| 列名称 | 包含 | 
|---|---|
| FactCallCenterID | 将数据导入数据仓库时创建的任意键。 此列用于标识唯一记录,应该用作数据挖掘模型的案例键。  | 
| DateKey | 呼叫中心操作日期,以整数形式表示。 整数日期键通常用于数据仓库,但如果想按日期值进行分组,则可能希望将日期转换为日期/时间格式。 请注意,日期并不唯一,因为供应商为每天作中的每个班次提供单独的报表。  | 
| WageType | 指示当天是工作日、周末还是假日。 周末与工作日的客户服务质量可能存在差异,因此你将使用此列作为输入。  | 
| 转变 | 指示记录通话的班次。 此呼叫中心将工作日分为四个班次:AM、PM1、PM2 和午夜。 这种转变可能会影响客户服务的质量,因此你将将其用作输入。  | 
| LevelOneOperators | 指示值班的级别 1 运算符的数目。 呼叫中心员工从级别 1 开始,这样这些员工就不太有经验了。  | 
| LevelTwoOperators | 指明值班的 2 级操作员的数量。 员工必须记录一定数量的服务小时数才能获得级别 2作员的资格。  | 
| TotalOperators | 班次期间参与的操作员总数。 | 
| 调用 | 班次期间接到的呼叫数。 | 
| AutomaticResponses | 由自动呼叫处理(交互式语音响应或 IVR)完全处理的呼叫数。 | 
| 订单 | 电话呼叫产生的订单数。 | 
| 提出的问题 | 通过电话生成的需要跟进的问题数量。 | 
| 每个问题的平均时间 | 响应传入呼叫所需的平均时间。 | 
| 服务等级 | 一个指标,指示一般服务质量,测量为整个班次的 放弃率 。 放弃率越高,客户就越可能不满,潜在订单会丢失。 | 
请注意,数据包括四个不同的列,这些列基于单个日期列:WageTypeDayOfWeek 和ShiftDateKey。 通常,在数据挖掘中,使用从同一数据派生的多个列并不好,因为值相互关联太强,并且可能会掩盖其他模式。
但是,我们不会在模型中使用 DateKey ,因为它包含过多的唯一值。 与 DayOfWeek 之间Shift没有直接关系,并且 WageTypeDayOfWeek 仅部分相关。 如果担心共性,则可以使用所有可用列创建结构,然后忽略每个模型中的不同列并测试效果。