本主题介绍 Data Quality Services(DQS)中的域的使用。 域包含要分析的数据源中特定字段中数据的语义表示形式。 域是为数据源创建的知识库的一部分,通过分析示例数据源或导入数据来构建的知识将添加到知识库中定义的域中。 这些域中的知识稍后用于在数据质量项目中执行清理和匹配。 数据质量服务中的所有活动都以域为核心。
一个域被映射到一个数据源字段,并在知识发现、域管理和匹配活动中被填充。 如何从数据源加载数据以及如何在报表中输出数据,这些操作都在域属性中进行定义。 使用引用数据提供程序清理数据时,可将引用数据服务附加到单个或复合域。 创建要应用于域中数据的规则,可以为域创建基于术语的关系。 可以在域中查看和更正数据。
还可以创建一个复合域,该域由两个或多个单独的域组成,每个域包含有关通用数据的知识。 有关详细信息,请参阅 “管理复合域”。
域属性
创建域时,可以使用以下选项来填充源数据中的域以及如何输出域值。 有关详细信息,请参阅 “设置域属性”。
选择填充域的数据的类型。 有关每个域数据类型支持的数据类型的信息,请参阅 DQS 域支持的 SQL Server 和 SSIS 数据类型。
指定仅从域输出前导值,而不是其同义词。
根据数据类型,指定以特定格式输出域值。
如果数据类型是字符串,则可以通过在将字符串从数据源加载到域中时删除特殊字符来规范化字符串。
如果数据类型是字符串,您可以运行 DQS 拼写检查器以检查字符串的语法、拼写和句子结构,并在域管理的域值页面中指出任何潜在错误。 这包括选择拼写检查器运行时使用的语言。
如果数据类型是字符串,则当知道字符串中不会发生语法错误时,可以指定 DQS 不会标识语法错误。
本节中
使用域可以执行以下操作:
| 为具有特定数据类型的数据字段创建语义表示形式,指定域的填充方式,并设置域输出的格式 | 创建域 |
| 将域链接到另一个域,使它能够共享相同的设置和值 | 创建链接域 |
| 将引用数据服务附加到单个或复合域 | 将域或复合域附加到引用数据 |
| 更改或扩充知识库中的值 | 更改域值 |
| 使用验证和标准化规则 | 创建域规则 |
| 利用关系来纠正作为域值一部分的术语。 | 创建 Term-Based 关系 |
| 完成、关闭或取消域管理活动 | 结束域管理活动 |
相关任务
| 任务说明 | 主题 |
|---|---|
| 通过运行知识发现和以交互方式管理知识来构建知识库 | 构建知识库 |
| 将知识导入知识库或将其从中导出。 | 导入和导出知识 |
| 创建一个复合域,并向该域添加知识。 | 管理复合域 |