你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要
仅为方便起见,提供非英语翻译。 请查阅 EN-US 文档以获取最终版本。
什么是透明度说明?
重要
本文假设你熟悉 Azure AI 语言的指南和最佳做法。 有关详细信息,请参阅 Azure AI 语言的透明度说明。
AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 创建一个适合其预期用途的系统需要了解技术的工作原理、功能和局限性,以及如何实现最佳性能。 Microsoft 的透明度说明旨在帮助你了解 AI 技术的工作原理、系统所有者可通过哪些选择来影响系统性能和行为,以及保持系统全局观(包括技术、人员和环境)的重要性。 你可以在开发或部署自己的系统时使用透明度说明,或者与使用你的系统或受其影响的人员共享透明度说明。
Microsoft的透明度说明是Microsoft将 AI 原则付诸实践的更广泛努力的一部分。 若要了解详细信息,请参阅Microsoft中负责任的 AI 原则。
关键短语提取简介
借助 Azure AI 语言 关键短语提取 功能,可以快速识别文本中的主要概念。 例如,在文本“食物美味,有美妙的工作人员”,关键短语提取将返回主要谈话要点:“食物”和“美妙的工作人员”。 非必要词汇将被省略,而那些看似句子主语或宾语的单词或短语则会被保留。
请注意,与其他一些 Azure AI 语言功能不同,此功能不会返回置信度分数。
示例用例:
关键词提取用于多个行业的不同场景。 一些示例包括:
- 增强搜索。 关键短语可用于创建可增强搜索结果的搜索索引。 例如,客户可以提供数千个文档,并使用内置的 Azure 搜索技能在这些文档上运行关键短语提取。 结果是输入数据集中的关键短语,然后可用于创建索引。 只要有可用的新文档集,就可以再次运行技能来更新此索引。
- 查看文本数据的聚合趋势。 例如,可以使用关键短语生成单词云,以帮助在文本注释或反馈中可视化关键概念。 例如,酒店可以根据评论中识别的关键短语生成一个单词云,并可能发现人们最常评论地点、清洁和有用的员工。
选择用例时的注意事项
请勿使用
- 请勿在高风险情形下使用自动操作而无人干预。 当其他人的经济状况、运行状况或安全受到影响时,人员应始终查看源数据。
法律和法规注意事项:组织在使用任何 AI 服务和解决方案时需要评估潜在的特定法律和监管义务,这些义务可能不适合在每个行业或方案中使用。 此外,AI 服务或解决方案的设计目的并非用于适用服务条款和相关行为准则所禁止的用途,也不得以其中所禁止的方式使用。
特征和限制
根据您的情境和输入数据,您可能会体验不同的性能水平。 以下信息旨在帮助你了解有关性能的关键概念,因为它们适用于使用 Azure AI 语言关键短语提取功能。
提高性能的系统限制和最佳做法
与其他 Azure AI 语言功能模型不同,关键短语提取模型是一种无监督模型,没有经过人工标记的基准数据训练。 发送到服务的文本中的所有名词短语都会被检测到,然后根据频率和共现进行排名。 因此,模型返回的内容可能与人类选择的最重要短语不一致。 在某些情况下,模型可能会出现部分正确的情况,即返回的名词没有修饰它的形容词。
- 文本越长,表现会越好。 不要将源文本分解成句子或段落。 发送整个文本,例如,客户评价或论文摘要。
- 如果文本包含一些样本或其他与你尝试分析的实际内容没有主题相关性的文本,则此文本中的单词会影响结果。 例如,电子邮件可能在文本中包含“主题:”、“正文:”、“发件人:”等。 建议在将文本发送到服务之前删除不属于尝试分析的实际内容的任何已知文本。