为呼叫中心数据添加数据源视图(中间数据挖掘教程)

在此任务中,将添加一个数据源视图,该视图将用于访问呼叫中心数据。 相同的数据将用于生成用于探索的初始神经网络模型,以及用于提出建议的逻辑回归模型。

你还将使用数据源视图设计器为一周中的某一天添加列。 这是因为,虽然源数据按日期跟踪呼叫中心数据,但你的体验会告诉你,通话量和服务质量都有定期模式,具体取决于当天是周末还是工作日。

过程

添加数据源视图

  1. 解决方案资源管理器中,右键单击 “数据源视图”,然后选择“ 新建数据源视图”。

    此时会打开“数据源视图向导”。

  2. “欢迎使用数据源视图向导” 页上,单击“ 下一步”。

  3. “选择数据源”页中,选择 关系型数据源下的 Adventure Works DW 多维 2012 数据源。 如果没有此数据源,请参阅 基本数据挖掘教程。 单击 “下一步”

  4. 在“ 选择表和视图 ”页上,选择下表,然后单击右箭头将其添加到数据源视图:

    • FactCallCenter (dbo)

    • DimDate

  5. 单击 “下一步”

  6. “完成向导” 页上,默认情况下,数据源视图名为 Adventure Works DW 多维 2012。 将名称更改为 CallCenter,然后单击“ 完成”。

    将打开数据源视图设计器以显示 CallCenter 数据源视图。

  7. 在“数据源视图”窗格中右键单击,然后选择“ 添加/删除表”。 选择该表 ,DimDate 并单击“ 确定”。

    应在每个表中的 DateKey 列之间自动添加关系。 你将使用此关系从 DimDate 表获取列 EnglishDayNameOfWeek,并在模型中使用它。

  8. 在数据源视图设计器中,右键单击表 FactCallCenter,然后选择“ 新建命名计算”。

    在“ 创建命名计算 ”对话框中,键入以下值:

    列名 DayOfWeek
    说明 从 DimDate 表中获取星期几
    表达式 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    若要验证表达式是否创建了所需的数据,请右键单击表 FactCallCenter,然后选择“ 浏览数据”。

  9. 花一分钟时间查看可用的数据,以便了解它在数据挖掘中的用法:

列名称 包含
FactCallCenterID 将数据导入数据仓库时创建的任意键。

此列用于标识唯一记录,应该用作数据挖掘模型的案例键。
DateKey 呼叫中心操作日期,以整数形式表示。 整数日期键通常用于数据仓库,但如果想按日期值进行分组,则可能希望将日期转换为日期/时间格式。

请注意,日期并不唯一,因为供应商为每天作中的每个班次提供单独的报表。
WageType 指示当天是工作日、周末还是假日。

周末与工作日的客户服务质量可能存在差异,因此你将使用此列作为输入。
转变 指示记录通话的班次。 此呼叫中心将工作日分为四个班次:AM、PM1、PM2 和午夜。

这种转变可能会影响客户服务的质量,因此你将将其用作输入。
LevelOneOperators 指示值班的级别 1 运算符的数目。

呼叫中心员工从级别 1 开始,这样这些员工就不太有经验了。
LevelTwoOperators 指明值班的 2 级操作员的数量。

员工必须记录一定数量的服务小时数才能获得级别 2作员的资格。
TotalOperators 班次期间参与的操作员总数。
调用 班次期间接到的呼叫数。
AutomaticResponses 由自动呼叫处理(交互式语音响应或 IVR)完全处理的呼叫数。
订单 电话呼叫产生的订单数。
提出的问题 通过电话生成的需要跟进的问题数量。
每个问题的平均时间 响应传入呼叫所需的平均时间。
服务等级 一个指标,指示一般服务质量,测量为整个班次的 放弃率 。 放弃率越高,客户就越可能不满,潜在订单会丢失。

请注意,数据包括四个不同的列,这些列基于单个日期列:WageTypeDayOfWeekShiftDateKey。 通常,在数据挖掘中,使用从同一数据派生的多个列并不好,因为值相互关联太强,并且可能会掩盖其他模式。

但是,我们不会在模型中使用 DateKey ,因为它包含过多的唯一值。 与 DayOfWeek 之间Shift没有直接关系,并且 WageTypeDayOfWeek 仅部分相关。 如果担心共性,则可以使用所有可用列创建结构,然后忽略每个模型中的不同列并测试效果。

课程中的下一个任务

创建神经网络结构和模型(中间数据挖掘教程)

另请参阅

多维模型中的数据源视图