本主题介绍如何在 Data Quality Services (DQS)中创建域。 域中的值是字段中数据的语义表示形式。 有关域的详细信息,请参阅 “管理域”。
有两种方法可以创建新域。 第一个是在知识发现活动的 Map 步骤中,当你正在分析数据示例以将知识添加到新的或现有的知识库时。 第二种情况是在域管理活动期间,而不是更改现有域,而是创建一个新的域。
在您开始之前
先决条件
若要创建域,必须已创建并打开知识库。
安全
权限
必须在DQS_MAIN数据库中具有dqs_kb_editor角色或dqs_administrator角色才能创建域。
在知识发现活动中创建领域
启动数据质量客户端。 有关执行此作的信息,请参阅 “运行数据质量客户端应用程序”。
在“数据质量客户端主屏幕”中,单击“ 打开知识库 ”,然后选择知识库,或单击“ 新建知识库 ”并输入新知识库的属性。
选择 “知识发现 ”作为活动,然后单击“ 创建 ”以创建新知识库或 打开 以打开现有知识库。
在 “映射 ”页上,指定与数据源的连接。 有关详细信息,请参阅 执行知识发掘。
在 “映射” 表中,为空行的 “源列” 列从下拉列表中选择一个源列。 如果不存在相应的域,请单击“ 创建域” 图标。
在域管理操作中创建域
在“数据质量客户端主屏幕”中,单击“ 打开知识库 ”,然后选择知识库,或单击“ 新建知识库 ”并输入新知识库的属性。
选择 “域管理 ”作为活动,然后单击“ 创建 ”以创建新知识库或 打开 以打开现有知识库。
在 “域管理 ”页上,单击“域”列表上方 的“创建域 ”图标。
设置域属性
在“ 创建域 ”对话框中,输入知识库唯一的名称和最多 256 个字符的说明。
注释
有关域属性的详细信息,请参阅 “设置域属性”。
从 “数据类型” 列表中,为域中的值选择数据类型。 数据类型可以是 String (默认值)、 日期、 整数或 十进制。
选择 “使用前导值”,以指定在一组同义词中输出前导值,而不是输出与其同义的值。 取消勾选 “使用前导值” 以便每个同义词值以其正确或修正过的形式输出,而不会被替换为其组的前导值。
如果数据类型为 String,请选择 Normalize String 以删除域值中的特殊字符,这可能会提高匹配的可能性。
在 “格式输出到” 下拉列表中,选择将在域中的数据值输出时应用的格式。 格式特定于步骤 2 中选择的数据类型,如以下列表所示:
对于字符串值,可以指定将字符串输出为大写、小写或大写。
对于日期值,可以指定日、月和年的格式。
对于整数值,可以指定要应用的格式掩码的类型。
对于十进制值,可以指定要应用的格式掩码的准确性和类型。
在“格式输出”下拉列表中选择“无”意味着列表中不会应用任何格式。
如果数据类型为 String,请在 “语言 ”下拉列表中,选择要应用的拼写器的语言版本(如果启用拼写检查器)。
如果数据类型为 String,请选择“ 启用拼写检查器 ”以在填充域时对所有字符串值运行拼写检查器。
如果数据类型为 String,请选择“ 禁用语法错误算法 ”以填充域,而无需检查语法错误的字符串值。
单击 “确定” 。
单击“ 完成 ”以完成域管理活动,如 “结束域管理活动”中所述。
后续步骤:创建域后
创建域后,可以对域执行其他域管理任务,可以执行知识发现以将知识添加到域,也可以向域添加匹配策略。 有关详细信息,请参阅 “执行知识发现”、“ 管理域”或 “创建匹配策略”。