你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要
仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。
什么是透明度说明?
重要
健康文本分析功能是“按原样”提供的,“并且存在所有可能的缺陷”。 健康状况文本分析不应用于或不可供用于医疗设备、临床支持、诊断工具或者其他旨在用于诊断、治愈、缓解、治疗或预防疾病或其他健康问题的技术,Microsoft 不授予将此功能用于此类目的的任何许可或权利。 此功能不旨在代替专业人员医疗建议或保健意见、诊断、治疗或医疗保健专业人员临床判断而实施或部署,并且不应用作此用途。 客户独自负责健康状况文本分析的任何使用。 客户必须就其打算使用的每一个源词汇,单独根据 UMLS 元同义词库许可协议附录或任何未来等效链接规定的条款进行许可。 客户负责确保遵守这些许可条款,包括任何地理限制或其他适用限制。
医疗文本分析现在允许提取文本中的社会健康决定因素 (SDOH) 和种族相关信息。 此功能可能无法涵盖所有潜在的 SDOH,并且不会根据 SDOH 或种族得出推理(例如,会提取物质使用信息,但不会推断药物滥用情况)。 利用医疗文本分析的输出做出的所有影响个人或资源分配(包括但不限于与计费、人力资源或治疗护理管理)的决策都应在人工监督下做出,而不能仅基于模型的结果。 SDOH 和种族信息提取功能的目的是帮助提供商改进健康结果,不应用于对 SDOH 数据的用户或使用者或患者群体进行污名化或引证负面推理,不能超出帮助提供商改进健康结果的既定目的。
AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 创建一个适合其预期用途的系统需要了解技术的工作原理、功能和局限性,以及如何实现最佳性能。 Microsoft 的透明度说明旨在帮助你了解 AI 技术的工作原理、系统所有者可通过哪些选择来影响系统性能和行为,以及保持系统全局观(包括技术、人员和环境)的重要性。 你可以在开发或部署自己的系统时使用透明度说明,或者与使用你的系统或受其影响的人员共享透明度说明。
Microsoft的透明度说明是Microsoft将 AI 原则付诸实践的更广泛努力的一部分。 若要了解详细信息,请参阅Microsoft 中负责任的 AI 原则 。
健康文本分析的基础知识
介绍
Azure AI 语言的健康文本分析功能使用自然语言处理技术,在非结构化文本中查找和标记有价值的健康信息,例如诊断、症状、药物和治疗。 该服务可用于各种类型的非结构化医疗文档,包括出院摘要、临床说明、临床试验协议、医疗出版物等。 健康文本分析执行命名实体识别(NER)、提取已识别实体之间的关系、显示断言(如否定和条件性),以及将检测到的实体链接到常见词汇。
健康状况文本分析可接收英语的非结构化文本,作为其正式版产品/服务的一部分。 预览版产品/服务目前支持其他语言。 有关详细信息,请参阅语言支持。
可以阅读 API 及其功能的 概述 。 另请参阅 支持的实体和关系。
此外,现在自定义健康状况文本分析(一项新的预览功能)下,为健康状况文本分析提供自定义功能。 自定义健康文本分析 允许客户使用自己的数据训练一个专为医疗保健设计的自定义 NER 模型,以便提取他们领域特定的类别,从而扩展现有的健康文本分析的实体映射。 客户还可以为新定义的自定义实体以及健康实体(如药物名称)的现有文本分析定义词典或特定词汇。 因此,健康文本分析的自定义版本提供了与健康文本分析相同的功能,并可通过添加新的机器学习实体和向现有实体加入自定义词汇来扩展现有实体映射的能力。
关键术语
健康文本分析当前对生物医学文本执行命名实体识别(NER)、关系抽取、断言检测和实体链接。 还可使用习得实体和列表组件进行额外的自定义实体提取来对其进行补充,这些内容现可使用自定义健康状况文本分析获取。
| 术语 | 定义 |
|---|---|
| 命名实体识别 | 检测非结构化文本中提及的字词和短语,这些字词和短语可以与一个或多个语义类型(如诊断、药物名称、症状或符号或年龄)相关联。 |
| 关系提取 | 标识文本中提到的概念之间的有意义的连接。 例如,通过将条件名称与时间关联来找到“条件时间”关系。 |
| 断言检测 | 显示文本中提到的实体修饰符,例如否定或条件性。 医疗内容的含义可能会受到这些修饰符的高度影响。 |
| 实体链接 | 通过将文本中提到的命名实体与预定义的概念(如统一医疗语言系统(UMLS)中的概念)相关联,来消除不同实体的歧义。 |
| 实体习得组件 | 允许通过训练具有标记数据的自定义模型来定义新的自定义实体,例如治疗、设施或医疗设备。 |
| 实体列表组件 | 通过使用词典识别器定义与所选实体对应的同义词或词汇列表,允许提取新的自定义实体或现有的健康实体文本分析。 例如,“药物 A”可以定义为药物名称实体下的新列表值。 |
能力
系统行为
若要使用健康文本分析,您需要输入用于分析的原始非结构化文本,并在您的应用程序中处理 API 输出。 在单个 API 调用中执行四个关键函数:实体识别、关系提取、实体链接和断言检测。 在 as-is上执行分析,无需对预训练模型进行额外的自定义。 可以使用托管 API 或在本地环境中的容器中部署的方式,来进行用于健康的文本分析。 有关详细信息,请参阅 如何调用健康文本分析。
若要自定义健康状况文本分析,请使用自定义健康状况文本分析的创作体验创建新实体来扩展现有预构建的实体映射。 还可以为新的自定义实体以及现有的预生成实体类别(如药物名称)使用精确匹配来定义要识别的新词汇。 定义项目的实体映射后,可以训练和部署自定义模型进行预测。 默认情况下,已部署的自定义模型支持健康文本分析中预构建实体类别的所有已有功能。 此外,自定义模型为新的实体类别提供自定义 NER,还提供为预构建实体定义的任何字典。 因此,预测自定义模型会针对健康状况文本分析实体执行命名实体识别、关系提取、实体链接和断言检测,还会执行自定义命名实体识别,以提取客户定义的实体类别并为新的和现有实体类别提供已定义的词汇。 用于训练自定义模型的所有数据都将存储在专用 Blob 存储中。 此外,调用自定义模型需要 APIM 订阅密钥,这意味着自定义模型仅适用于你与之共享密钥的用户。
预期用例
健康状况文本分析可在这类系统支持的各种行业的多个场景中使用。 使用适用于健康行业的文本分析的一些常见客户动机包括:
- 协助并自动处理医疗文档,以便进行适当的编码,以提高护理和计费的准确性。
- 提高分析医疗保健数据的效率,以帮助推动基于价值的护理模型(例如医疗保险)的成功。
- 改进关键数据的聚合,以跟踪患者护理和历史记录的趋势,而不会增加医疗保健提供商的开销。
- 取得进展,采用HL7标准,这是交换、集成、共享和检索电子健康信息的框架,以支持日常临床实践和管理以及卫生服务的整体交付和评估。
相同的用例和注意事项适用于医疗健康的自定义文本分析,但自定义文本分析在以下场景中更为适合:客户拥有数据,并希望通过创建自己的实体类别或定义新旧实体类别的词汇来扩展现有的预构建实体映射。
示例用例:
以下用例是健康文本分析和自定义健康文本分析功能的常见示例:
- 见解和统计信息提取。 在临床笔记和各种临床文档中识别医学实体,如症状、药物和诊断。 使用此信息可生成有关患者群体的见解和统计信息、搜索临床文档以及研究文档和出版物。
- 从历史数据创建预测分析和预测模型。 基于使用历史数据创建的预测模型,实现规划、决策支持、风险分析等解决方案的开发。
- 辅助注释和策展。 支持临床数据注释和策展解决方案。 例如,为了支持临床编码、手动创建的数据数字化以及注册表报告的自动化。
- 支持用于显示或分析与健康相关信息的解决方案。 支持显示或分析与健康相关信息的解决方案。 例如,出于报告目的,支持质量保证流程或标记人工审查的可能错误。
选择用例时的注意事项
从非结构化医疗文本管理和提取知识时,文本分析健康是一个有价值的工具。 但是,鉴于健康相关数据的敏感性,请务必仔细考虑您的用例。 在所有情况下,人员都应根据系统返回的信息做出决策,在所有情况下,都应有办法查看源数据并更正错误。 选择用例时,下面是一些其他注意事项:
- 避免将此服务用作医疗设备、提供临床支持或作为诊断工具用于诊断、治愈、缓解、治疗或预防疾病或其他疾病的方案,而无需人工干预。 合格的医疗专业人员应始终尽职尽责,并验证可能影响患者护理决策的源数据。
- 避免与在没有人工干预的情况下自动授予或拒绝医疗服务或健康保险相关的情况。 由于影响覆盖率级别的决策具有极大的影响,因此应始终在这些方案中验证源数据。
- 避免在未经患者同意或不符合法律规定的情况下使用个人健康信息。 健康信息对隐私和同意有特殊保护。 请确保你使用的所有数据都获得了患者对于数据使用方式的同意,或者在使用健康信息方面遵守适用法律。
- 仔细考虑使用检测到的实体来自动更新患者记录,而无需人工干预。 确保始终有一种方法来报告、跟踪和更正任何错误,以避免将不正确的数据传播到其他系统。 确保合格专业人员审查和批准患者记录的任何更新。
- 慎重考虑在没有人工干预的情况下在患者计费中使用检测到的实体。 确保提供商和患者始终能够报告、跟踪和更正生成错误计费的数据。
- 慎重考虑使用检测到的健康的社会决定因素和种族实体的场景。 始终确保有办法报告、跟踪和更正任何错误,以避免错误物质使用推理或基于社会和人口因素提供不正确的护理形式。
- 请仔细考虑在微调自定义用于健康的文本分析模型时使用自动反馈循环的场景。 在部署到生产环境之前,始终确保测试和评估模型,以避免模型质量回归,因为自定义模型训练是一个对输入训练数据非常敏感的迭代过程。
- 法律和法规注意事项:组织在使用任何 AI 服务和解决方案时需要评估潜在的特定法律和监管义务,这些义务可能不适合在每个行业或方案中使用。 此外,AI 服务或解决方案并未设计为按适用服务条款和相关行为准则禁止的方式使用,也不得按这类方式使用。
健康与种族的社会决定因素
健康状况文本分析支持在文本中提取健康的社会决定因素 (SDOH) 和种族提及信息。 使用社会和人口统计学实体可以帮助识别出除直接医疗护理外能够影响健康结果的一系列因素,例如基础遗传学、健康行为以及社会和环境因素。 利用文本分析健康 SDOH 实体提取功能,可以降低通常植根于社会和经济劣势的健康差异,改善护理,评估健康不平等问题,并将未充分代表的群体纳入临床试验和研究。 有关详细信息,请参阅 社会健康决定因素, FDA 采取重要步骤来提高临床试验中的种族和种族多样性 |FDA和县健康排名:确定因素与健康结果之间的关系。
此功能不会根据 SDOH 或种族推断结果(例如,从输入文本中提取出物质使用信息,但不会基于提取的实体推断为药物滥用)。 依赖于用于健康的文本分析的输出并影响个人或资源分配的所有决策(包括但不限于与计费、人力资源或护理管理相关的决策)都应在人工监督下做出,而不应仅依据模型的结果。 SDOH 和种族提取能力的目的是帮助提供者改善健康结果。 不应使用它们来污名化或者对 SDOH 数据的用户或消费者,以及患者群体进行负面推测,而这些行为应限制在帮助提供者改善健康结果的既定目的范围内。 与提取的其他实体一样,健康状况文本分析响应也会返回关于生活状态、就业情况、物质使用情况和种族实体的置信度分数。 在考虑实体预期使用时,仔细权衡置信度分数。
用于健康的自定义文本分析
医疗文本分析工具使开发人员能够从非结构化医疗数据中处理和提取见解。 尽管健康功能能够处理和提取大量的数据类型和实体类别,但有时客户可能希望添加一个特定于其数据的新实体类型,甚至在现有实体类别中定义附加的医疗词汇。
因此,健康领域的自定义文本分析的目的是在健康文本分析的基础上,通过允许客户将特定于其数据的全新实体类别扩展到实体映射中,以及向现有实体类别添加自定义词汇,从而提供一种定制化的方法。
自定义健康文本分析允许客户使用标记数据和自定义字典/词汇来训练自定义医疗保健实体提取 ML 模型。 这将允许客户定义特定于其数据的新医疗实体。 该服务还会在内部调用健康状况文本分析,提供健康状况文本分析中已提供的所有功能和实体映射。 为了增加自定义程度,客户将能够将自己的词汇添加到现有的健康实体文本分析中,从而用他们的数据补充预建立的响应。
客户负责提供足够的标签数据和词汇来训练自定义模型;因此,模型的性能可能因客户相对于要定义的新实体类别使用的标记训练数据的质量和全面性而异。 建议在部署到生产环境之前始终测试和评估模型,以避免模型质量回归,因为自定义模型训练是一个对输入训练数据非常敏感的迭代过程。
局限性
- 覆盖范围:SDOH 提取功能可能并不涵盖所有潜在的 SDOH。 识别仅限于此处列出的种族和实体类型。健康文本分析识别的实体类别 - Azure AI 服务 | Microsoft Learn。
- 语言:目前,仅对英语文本启用了 SDOH 和种族提取功能。 健康状况文本分析可接收英语的非结构化文本,作为其正式版产品/服务的一部分。 预览版产品/服务目前支持其他语言。
- 拼写:拼写错误可能会影响输出。 具体而言,实体链接仅根据特定的正确拼写查找术语和同义词。 例如,如果药物名称拼写错误,系统可能会有足够的信息来识别该文本为药物名称,但可能无法像识别正确拼写的药物名称那样识别其链接。
- 性能:下面“系统性能”部分概述了潜在的错误类型。
- 健康文本分析的自定义功能(预览版):支持健康文本分析所支持的所有语言。 若要训练自定义模型,需要为每个新定义的自定义实体类别提供至少 10 个标签的训练服务。 为了训练自定义模型,客户必须将至少 10 个文档添加到项目的数据集。 用于提取客户定义词汇的词典识别器依赖于指定语言的精确大小写匹配,这意味着客户必须添加特定单词的所有变体,并为其项目的所有输入语言包含该变量。 使用自定义健康状况文本分析时,健康状况文本分析支持实体链接、关系提取和断言检测,但这些功能不会应用于任何新定义的自定义实体类别。
系统性能
对于健康状况功能支持的各项能力,健康状况文本分析和自定义健康状况文本分析通常可能出现假正和假负错误。 后续部分介绍了潜在错误类型的几个示例。
命名实体识别 (NER)
假正
在 NER 中,当系统错误地将实体标识为属于类别时,会发生误报。 在以下示例中,COVID-19 被错误标记为EXAMINATION_NAME。 事实上,COVID-19 是诊断,而不是检查的名称。 因此,这是 EXAMINATION_NAME 的假正例。
第二个示例中,vodka 是 MEDICATION_NAME 的假正例。 相反,它应分类为 SUBSTANCE_USE。
假负
当某个实体应被标识为属于某个类别,但却未被标识时,NER 中会出现假负。 在以下示例中,实体 ER 应已标识为CARE_ENVIRONMENT,但不是。 如果一个实体未被正确识别,那么链接的代码也不会被识别。
在接下来的两个示例中,第二次提及种族和有关以前就业的信息未被正确识别。
关系提取
假正
在关系提取中,当某个关系不应被标识出,但却被标识时,会出现假正。 在下一个示例中,AST 检测的值被错误地分配给 ALT 检测,而 ALT 检测已经被分配了测量值。
假负
在关系提取中,当某个关系应被标识出,但却未被标识时,会出现假负。 在前面的示例中,度量值 45 未分配到 AST 测试,实际上应该被分配。
实体链接
假正
实体链接是通过查找常见词汇和已识别实体中概念之间的完全匹配来实现的。 当在极少数情况下实体被捕获,而实际上不该被获取(假正 NER),并且词汇中似乎存在匹配的概念时,实体链接就会出现假正。 对于在常见词汇中具有多个不同匹配概念的模糊术语,实体链接也可能出现假正。
假负
由于实体链接与原始文本完全匹配,因此如果有足够的信号来正确识别实体,但该实体的拼写在文本中不正确,则可能获得假阴性。 例如,在以下文本中,“therapies”(疗法)拼写有误,你不会获得相应的链接实体 UMLS:C0087111。
断言检测
假正
在断言检测中,当系统标识文本中不应存在的断言时,将发生误报。 在以下示例中,“呼吸系统疾病”实体被错误地否定为诊断出新冠肺炎。
假负
未捕获到断言时,断言检测中出现假负。 在下面的示例中,应否定症状“响应”,因为没有对上述药物的反应。
提高系统性能的最佳做法
- 健康领域的自定义词汇的自定义文本分析使用精确的单词匹配;因此,不正确的拼写可能会影响实体识别。
- 为了提高自定义健康状况文本分析使用习得实体组件基于 ML 进行实体提取的质量,建议为每个自定义实体提供均衡分布的标签,并为代表输入数据的示例的每个实体提供至少 15 个标签。
健康文本分析评估
评估方法
文本健康分析根据不同类型的非结构化医疗文档进行训练和评估,包括出院摘要、临床说明、临床试验协议、医疗出版物等。 SDOH 模型显示生活状况、就业和物质使用实体,根据来自两个独立来源的手动批注数据集进行训练和评估:大约 750 个随机采样的专有临床笔记和大约 1,500 份临床笔记从美国医疗中心提供的语料库随机采样,主要集中在成人患者身上。 原始语料库涵盖了 10 多年所收集的数据和数千名患者的入院记录。 它提供男女病人几乎平等的代表性。 应指出,尚未进一步分析训练数据代表性(例如地理、人口统计或民族学表示形式)。 尽管内部测试演示了模型可能通用化到不同的人口和地理区域,但你应该仔细考虑训练和评估数据在预期用途的上下文中如何具有代表性。 为了评估与潜在公平危害有关的系统,评估数据集被社会和人口因素(如性别、年龄、种族、就业和生活状况)划分为文件子组。 评估了每个组的目标最低性能级别,组之间的相对性能差异也不同。
评估自定义健康状况文本分析
自定义健康状况文本分析利用自定义医疗保健基础模型,该模型基于客户提供的数据和预构建的健康状况文本分析模型进行微调。 使用的医疗保健基础模型是与构建健康实体映射的文本分析相同的基础模型。
自定义健康状况文本分析包含内部评估作为创作体验的一部分,这使得客户能够创建测试数据集,并评审所定义的自定义实体类别的 F1 分数、精准率和召回率分数。 健康状况文本分析预构建的实体不在内部评估范围内。 该体验还具有模型指南,可为客户提供改进测试结果分数的方法,例如为性能不佳的实体推荐其他标签。
评估并集成健康状况文本分析以供使用
Microsoft希望帮助你负责任地开发和部署使用 Azure AI 语言的解决方案。 这些注意事项符合我们开发负责任的 AI 的承诺。 决定如何使用和实现由 Azure AI 语言功能提供支持的产品和解决方案时,请考虑以下因素。
一般准则
当你为部署健康文本分析做准备时,以下活动将帮助你确保成功:
- 了解它能做什么:全面评估健康文本分析的能力,以了解其功能和限制。 了解它在方案和上下文中的执行方式。
- 使用真实和多样化的数据进行测试:了解健康文本分析在您的情境中将如何表现,通过使用反映您用户、地理位置和部署上下文的多样性和实际条件的数据进行全面测试。 不反映端到端方案的小型数据集、综合数据和测试不太可能充分表示生产性能。
- 尊重个人的隐私权利:仅出于合法和合理的目的收集或使用个人的数据和信息。 仅使用你同意使用或合法允许使用的数据和信息。
- 法律审查:获取解决方案的适当法律审查,尤其是在敏感或高风险应用程序中使用它时。 了解可能需要在哪些限制范围内工作,以及在使用前需要缓解的任何风险。 你有责任减轻此类风险并解决可能出现的任何问题。
- 系统评审:如果计划将 AI 驱动的产品或功能集成到现有系统中,无论是软件、客户还是组织流程,请花时间了解系统的每个部分将受到的影响。 考虑 AI 解决方案如何与Microsoft负责任的 AI 原则保持一致。
- 人机回环:让人员参与循环,并将人工监督作为要探索的一致模式领域包含在内。 这意味着不断对 AI 驱动的产品或功能进行人工监督,并确保人类在做出基于模型输出的任何决策中的作用。 为了防止伤害和管理 AI 模型的表现,请确保人类有一种方法实时干预解决方案。
- 安全性:确保你的解决方案是安全的,并且它具有足够的控制措施来保护内容的完整性并防止未经授权的访问。
- 客户反馈循环:提供反馈渠道,用户和个人可在部署服务后报告服务问题。 部署 AI 驱动的产品或功能后,需要持续监视和改进。 制定计划并准备好实施反馈和建议以改进。