在第 1 课中,你生成了供应商知识库,并用它来清理第 2 课中的数据,并使用工具 DQS 客户端匹配第 3 课中的数据。 在实际方案中,可能需要从 DQS 不支持的源拉取数据,或者想要自动执行清理和匹配过程,而无需使用 DQS 客户端 工具。 SQL Server Integration Services (SSIS) 具有组件,可用于集成来自各种异类源的数据和 DQS 清理转换 组件,以调用 DQS 公开的清理功能。 目前,DQS 不会公开要使用的 SSIS 匹配功能,但你可以使用 模糊分组转换 来标识数据中的重复项。
可以使用 基于实体的暂存功能将数据上传到 MDS。 在 MDS 中创建实体时,会自动创建相应的临时表和存储过程。 例如,创建供应商实体时,会自动创建 stg.supplier_Leaf 表和 stg.udp_Supplier_Leaf 存储过程。 使用中间表和程序创建、更新和删除实体成员。 在本课中,你将为供应商实体创建新的实体成员。 若要将数据加载到 MDS 服务器,SSIS 包首先将数据加载到临时表中stg.supplier_Leaf,然后触发关联的存储过程stg.udp_Supplier_Leaf。 有关更多详细信息,请参阅 导入数据 。
在本课中,你将执行以下任务:
删除 MDS 中的供应商数据(如果已完成前四课)。 在本课中创建的 SSIS 包会自动将数据上传到 MDS。 之前,使用 DQS 客户端手动将清理和匹配的供应商数据上传到 MDS 服务器。
在供应商实体上创建订阅视图,以向其他应用程序公开实体中的数据。 此作将创建一个 SQL 视图,该视图将使用 SQL Server Management Studio 进行验证。 在此版本的教程中,不会使用此视图。
使用 SQL Server Data Tools 创建和运行 SSIS 项目。 项目使用 数据清理 转换向 DQS 服务器提交清理请求。 DQS 尚未公开匹配的功能,因此你将使用 模糊分组 转换来标识重复项。
使用 Master Data Manger 验证是否在 MDS 中创建数据。
查看由 SSIS 包创建的 DQS 清理项目的结果,并选择性地执行交互式清理以进一步生成知识库。