你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

语言理解用例

重要

仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。

什么是透明度说明?

AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 创建一个适合其预期用途的系统需要了解技术的工作原理、功能和局限性,以及如何实现最佳性能。

Microsoft 提供了透明度说明来帮助你了解我们的 AI 技术工作原理。 这包括系统所有者可以做出的影响系统性能和行为的选择,以及考虑整个系统(包括技术、人员和环境)的重要性。 你可以在开发或部署自己的系统时使用透明度说明,或者与使用你的系统或受其影响的人员共享透明度说明。

透明度说明是 Microsoft 将其 AI 原则付诸实践的广泛努力的一部分。 若要了解详细信息,请参阅 Microsoft AI 原则

语言理解简介

语言理解(LUIS) 是基于云的聊天 AI 服务,用于将自定义机器学习智能应用于用户的自然语言文本。 它预测输入文本的总体含义,并从中提取特定信息。 LUIS 需要与客户端应用程序集成,它可以是与自然语言的用户通信以完成任务的任何对话应用程序。 最常见的客户端应用程序是聊天机器人。

客户端应用程序使用 LUIS 返回的输出做出决定或执行以满足用户请求的操作。 例如,用户在聊天机器人中键入“我想订购披萨”,该消息被发送到 LUIS 进行解释。 LUIS 分析输入文本,并在聊天机器人可以处理的形式返回其解释,将输入文本与预配置作链接,以便为用户订购披萨。 LUIS 仅用于理解客户端输入文本,不执行任何操作。 LUIS 当前 支持多种语言

语言理解的基础知识

LUIS 是端到端对话应用程序中的自然语言理解组件,用于预测传入文本的总体意图并从中提取重要信息。 该服务使其用户可以 自定义特定于域的 LUIS 应用程序 ,可在其中以迭代方式训练、测试和发布这些应用程序。 服务的用户需要提供与要生成的客户端应用程序域相关的训练数据并对其进行标记。 提供训练数据的质量非常重要,需要类似于预期的用户输入。 LUIS 提供了 一个 Web 门户 ,用于简化域专家和非技术用户的自定义体验。

有关详细信息,请参见:

语言理解术语

LUIS 中通常使用以下术语:

术语 定义
创作 撰写是 LUIS 应用程序发布前的阶段。 从创建应用程序、创建意向和实体模型、添加示例言语、标记言语、训练、测试和发布应用程序等一切内容都是创作阶段的一部分。 所有这些作都可以通过 LUIS 自定义门户或 REST API 来完成。
陈述 言语表示 LUIS 需要解释的最终用户的输入文本。 开发人员将示例话语作为训练数据添加到每个意图,并将其标记为他们希望提取的意图和实体,以用于训练 LUIS。 为每个意向添加示例语句时,有必要捕获使用不同术语的不同语句。 例如,“我想订购大奶酪披萨”是应用程序中订购披萨的示例话语。 了解详细信息
意图 意图是用户想要执行的任务或行动。 意向模型理解并分类输入文本的整体含义和意图。 开发人员定义一组意图,以触发用户希望在客户端应用程序中执行的操作。 例如,订购披萨的应用程序的意向可以是“制作订单”、“编辑订单”或“取消订单”。 了解详细信息
实体 实体表示与用户意向相关的言语中的单词或短语。 实体模型提取由开发人员定义的不同类型的实体。 在示例话语“我想订购一份大份奶酪披萨”中,开发人员可以定义一个“大小”实体来提取“大”这个词,以及一个“种类”实体以便从话语中提取“奶酪”这个词。 开发人员定义实体,以便从 LUIS 应用中的用户话语中提取关键数据。 创作 LUIS 应用时,开发人员 会使用 特定实体标记要在示例话语中提取的单词或多个单词。 了解详细信息
预生成的实体 预生成实体是预先训练的模型,可以识别常见类型的信息,例如名称、地理区域、日期、时间、数字和度量值。 在 LUIS 应用程序中包括预生成实体时,其预测将包含在已发布的应用程序中。 无法修改预生成实体。
预生成域 预生成域是预先训练的现成 LUIS 应用程序,其中包含预生成的意向和实体模型,以及标记的示例话语。 LUIS 提供了多个可添加的预生成应用程序域,例如家庭自动化或餐厅预订。 预生成域是完全可自定义的。 开发人员可以添加、编辑和删除意向、实体或示例话语并重新训练应用程序。 了解详细信息

示例用例:

LUIS 可在各种行业的多个方案中使用。 一些示例包括:

  • 在端到端聊天机器人中使用。 使用 LUIS 基于特定域和预期的用户话语生成和训练自定义自然语言理解模型。 将其与任何端到端聊天机器人集成,以便它可以实时处理和分析传入文本,以识别文本的意图并从中提取重要信息。 让机器人根据意图和提取的信息执行所需的作。
  • 人类助理机器人。 人工助理机器人的一个示例是,通过对客户查询进行会审并将其分配给适当的支持工程师来帮助员工改进客户参与度。 另一个示例是企业中的人力资源机器人,它允许员工以自然语言进行通信,并根据查询接收指导。
  • 命令和控制应用程序。 将客户端应用程序与语音转文本组件集成后,用户可以以自然语言朗讲命令,以便 LUIS 处理、识别意向,并从客户端应用程序的文本中提取信息以执行作。 此用例有许多应用程序,例如停止、播放、转发和倒退歌曲或打开或关闭灯。

选择用例时的注意事项

  • 不要将 LUIS 用于可能具有严重不利影响的决策, 例如,包括根据用户对事件的描述确定是接受还是拒绝保险索赔的用例。 此外,建议对可能给个人造成严重影响的决策进行人工审核。
  • 避免创建自定义实体来提取不必要的或敏感信息。 你需要确保创建的实体仅提取端到端场景所需的信息。 如果您不需要在您的场景中使用敏感信息,请避免提取它。 例如,如果你的方案需要提取用户的城市和国家/地区,请创建仅从用户地址中提取城市和国家/地区的实体,并且不要创建将提取其完整地址的实体。 为了确保模型是包容性的,请确保在训练数据中表示各种城市、国家/地区和地址格式(示例言语)。
  • 避免存储用户的个人数据。 默认情况下,LUIS 不会保留最终用户数据,但 LUIS 客户可以选择保留数据(然后应相应地中继给最终用户)。 如果选择保留用户数据,请避免存储专用用户数据(例如名称、出生日期或其他标识信息),或向包含专用用户数据的 LUIS 发送请求。 在将原始文本发送到 LUIS 模型之前,可以部署专用用户数据检测器或不雅内容筛选器。
  • 法律和法规注意事项:组织在使用任何 AI 服务和解决方案时需要评估潜在的特定法律和监管义务,这些义务可能不适合在每个行业或方案中使用。 此外,AI 服务或解决方案并未设计为按适用服务条款和相关行为准则禁止的方式使用,也不得按这类方式使用。

后续步骤