任务 3:创建并运行用于匹配的数据质量项目

在此任务中,你将为匹配活动创建一个数据质量项目,并针对清理的供应商数据运行匹配过程,以删除数据中的任何重复项。

  1. DQS 客户端的主页上,单击“ 新建数据质量项目”。

  2. 键入“从项目名称中删除供应商重复项”。

  3. “使用知识库”字段的 KB 列表中选择“供应商”。 已在上一课的此知识库中创建匹配策略。

  4. 在右下窗格的活动列表中选择匹配

    新建数据质量项目 - 匹配所选

  5. 单击 “下一步”

  6. 地图页面中,为数据源选择Excel文件

  7. 单击浏览并选择已清理的供应商List.xls,这是清理活动的输出文件。

  8. SupplierID 源列映射到 “供应商 ID 域”、“ 供应商名称 ”列到 “供应商名称 ”域,将 ContactEmailAddress 列映射到 “联系人电子邮件 ”域。

  9. 单击“ 下一步 ”切换到 “匹配 ”页。

  10. 单击“ 开始” 以启动匹配过程。 应会看到与上一任务的结果类似,因为你使用了相同的输入文件来定义匹配策略。

  11. 在列表框中查看所有匹配的记录及其匹配分数。 结果应与上一任务中看到的结果相同。 请参阅上一任务中的步骤以分析此匹配活动的结果。

  12. 单击“ 下一步 ”切换到 “导出 ”页。

下一步

任务 4:将结果从匹配活动导出到 Excel 文件