本主题介绍如何配置 Data Quality Services (DQS),以使用参考数据清理数据。 可以使用来自 Azure Marketplace 的引用数据,或直接从在线第三方提供商获取引用数据。
在您开始之前
先决条件
若要使用来自市场的引用数据,必须具有有效的市场帐户密钥。 有关创建市场帐户密钥的详细信息,请参阅 “创建帐户 ”(https://go.microsoft.com/fwlink/?LinkId=212936)。 还可以通过在数据质量客户端主屏幕中的“管理”下单击“配置”,然后单击“引用数据”选项卡下的“创建 DataMarket 帐户 ID”,从数据质量客户端内部创建市场帐户密钥。
安全
权限
必须在 DQS_MAIN 数据库中具有dqs_administrator角色,才能在 DQS 中配置引用数据服务设置。
配置 DQS 以使用来自市场的参考数据
启动数据质量客户端。 有关执行此作的信息,请参阅 “运行数据质量客户端应用程序”。
在“数据质量客户端主屏幕”的“ 管理”下,单击“ 配置”。
在“ 引用数据 ”选项卡的“ 网络设置” 区域下,如果你或你的组织使用代理服务器连接到 Internet,请在 “代理服务器 ”和“ 端口 ”框中键入适当的值。
在 DataMarket 帐户 ID 框中指定市场帐户密钥,然后单击“ 验证 DataMarket 帐户 ID ”图标来验证帐户密钥。 此时会显示一条消息,显示指定的市场帐户密钥是否有效。
现在,您可以使用 DQS 中订阅的 Marketplace 帐户密钥所提供的参考数据服务。
将 DQS 配置为使用来自在线直接第三方参考数据提供商的参考数据
启动数据质量客户端。 有关执行此作的信息,请参阅 “运行数据质量客户端应用程序”。
在“数据质量客户端主屏幕”的“ 管理”下,单击“ 配置”。
在“ 引用数据 ”选项卡的“ 网络设置” 区域下,如果你或你的组织使用代理服务器连接到 Internet,请在 “代理服务器 ”和“ 端口 ”框中键入适当的值。
在 Direct Online 第三方引用数据服务设置 区域中,单击 “添加新引用数据服务提供程序 ”图标。
在“ 创建新的 Direct Online 第三方引用数据服务提供程序 ”对话框中,指定以下详细信息:
在 “名称 ”框中,键入新的直接引用数据服务提供程序的名称。
(可选)在 “说明 ”框中,键入新的直接引用数据服务提供程序的说明。
在 “类别” 框中,键入新直接引用数据服务提供程序提供的数据类别。
在“架构”框中,指定要从直接引用数据服务提供程序使用的字段字符串(列名)的架构。 字段名称不应包含空格,字段应用逗号分隔。 例如:
FirstName, LastName, City, State。在 URI 框中,键入直接引用数据服务提供程序的 URI。 DQS 中仅允许安全 URI(以“https://”开头的地址)。
在 “最大批大小” 框中,键入每个批次发送到参考数据服务提供商进行清理的最大记录数。 每个批处理最多可以指定 100 条记录用于清理活动。
在 “帐户 ID ”框中,使用引用数据服务提供程序键入订阅者的帐户 ID。
单击 “确定” 保存数据,然后关闭“ 新建 Direct Online 第三方引用数据服务提供程序 ”对话框。 新添加的直接联机第三方引用数据提供程序在 DQS 的 直接引用数据提供程序网格 中可用。
现在,可以使用 DQS 中新配置的直接联机第三方引用数据服务提供商提供的引用数据服务。
跟进:配置 DQS 以使用引用数据后
现在,必须将所需的知识库域映射到刚刚配置的数据提供程序提供的引用数据。 为此,请参阅将域或复合域附加到引用数据。