随着时间的推移,需要向 MDS 存储库添加更多数据。 在添加数据之前,可以将新数据与已在 MDS 中管理的数据进行比较,以确保不会添加重复或不准确的数据。 在 Excel 的 Master Data Services 外接程序中,可以合并两个工作表中的数据,并比较数据,以便在将数据发布到 MDS 之前识别和删除重复项。 MDS Excel 外接程序的匹配功能使用 DQS 匹配功能来标识数据中的匹配项。 在此任务中,你将将两个工作表中的数据合并为一个工作表,然后执行匹配活动,以在发布到 MDS 之前识别和删除重复项。 有关更多详细信息,请参阅 Excel 的 MDS 外接程序中的数据质量匹配 和 合并数据 主题。
启动 Excel 的新实例。 单击“ 开始”,指向 “运行”,键入 Excel,然后单击“ 确定”。
通过单击菜单栏上的“主数据”切换到“主数据”选项卡。
单击“连接”和“加载”组中的功能区上的“连接”以连接到 MDS 服务器。 本课前面已配置此连接。
此时应会看到右侧的 “主数据资源管理器” 窗格。 如果未看到 Master 数据资源管理器,请单击功能区上的 “显示资源管理器” 按钮。
在“主数据资源管理器”窗口中,选择模型下拉列表中的“供应商”。 应会看到模型有一个实体: 供应商。
双击实体列表中的 “供应商 ”,将实体成员加载到 Excel 工作表中。
单击底部的 Sheet2 切换到 Sheet2 选项卡。如果未看到 Sheet2,请添加新工作表。
打开 Suppliers.xls 文件(教程文件中包含的原始输入文件),并将 CombineAndCleanse 工作表中的所有(三)行复制到 Sheet2。
切换回连接到 MDS 的 工作簿 1 - Microsoft Excel 中的 供应商 工作表(而不是 已清理和匹配的供应商列表 Excel)。
单击菜单栏上的 “主数据 ”。
单击功能区上的“合并数据”。 你将看到“ 合并数据 ”对话框。
在“ 合并数据 ”对话框中,单击 Range 旁边的按钮 以与 MDS 数据文本框合并 ,如下图所示。
现在您应该能看到缩小的对话框了。 现在,单击 Sheet2 切换到具有包含 4 行的新供应商数据的 Sheet2 选项卡(包括一个标题行)。
在 Sheet2 中,选择 包括标题行的所有行 (即使它们似乎已被选中)。 应会看到 要与 MDS 数据合并的范围 已自动更新。
切换回 “供应商 ”选项卡,而不关闭“ 合并数据 ”对话框。
单击文本框旁边的按钮。 此时应会看到对话框已展开。 应会看到 供应商 MDS 实体 的列与 Excel 列之间的所有映射会自动填充。
确保 代码 实体列映射到工作表中的 SupplierID 列, 邮政编码 实体列映射到工作表中的 邮政编码 列。
在“ 合并数据 ”对话框中,单击“ 合并”。
确认将三个数据行添加到工作表底部,并且它们应进行颜色编码。
单击功能区上的 “数学数据 ”以标识重复项。 此功能使用 DQS 的匹配功能。
在“匹配数据”对话框中,选择 DQS 知识库的供应商。
将工作表列映射到域,如下表所示。
工作表列 域名 代码(你上传了供应商 ID 作为 MDS 中供应商实体的代码) 供应商 ID 名称(已将供应商名称作为供应商实体的名称上传到 MDS) 供应商名称 联系电子邮件地址 联系邮箱 选择代码列映射的先决条件。
输入 70% 作为供应商姓名的权重,30% 作为联系人电子邮件的权重,如下图所示。
单击 “确定” 。
匹配过程应识别具有代码:S1的供应商的一个重复项。
选择 重复的行(橙色),右键单击,然后单击“ 删除 ”以删除该行。
删除 CLUSTER_ID 列,因为不再需要它。
单击“发布”将其他两条包含代码 S66 和 S57 的新记录发布到 MDS。
在 “发布和批注 ”对话框中,添加 批注,然后单击“ 发布”。
切换到 Master Data Manager Web 应用程序。
在主页上,确保为模型选择了“供应商”,然后单击“资源管理器”。 如果已打开 资源管理器 ,请刷新 Internet 浏览器。
按代码对列表进行排序,并查找包含 S57 和 S66 作为代码的记录。 还可以使用工具栏上的 “筛选 ”按钮搜索列表中的特定记录。
现在,关闭 Book1 - Microsoft Excel 窗口而不保存文件。