有关 Azure Cosmos DB 中Microsoft Fabric 镜像数据库的常见问题(预览版)

本文解答了有关 Microsoft Fabric 中的镜像 Azure Cosmos DB 数据库的常见问题。

重要

Azure Cosmos DB 的镜像目前为 预览版。 预览期间不支持生产工作负荷。 目前,仅支持用于 NoSQL 帐户的 Azure Cosmos DB。

一般问题

与 Azure Cosmos DB 的快捷方式有何不同?

镜像以开源增量格式将源数据库复制到 Fabric OneLake。 可以从 Fabric 中的任何位置对此数据运行分析。 快捷方式不会将数据复制到 Fabric OneLake。 而是将快捷方式链接到源数据,而无需移动数据。 目前,Azure Cosmos DB 仅可用作镜像的源。

镜像是否影响源 Azure Cosmos DB 数据库的性能?

否,镜像不会影响源数据库的性能或成本。 镜像要求在源 Azure Cosmos DB 帐户上启用连续备份功能。 连续备份可对事务工作负荷启用复制,而不会影响事务工作负荷。

镜像 Azure Cosmos DB 是否是 Fabric 中的管道复制作业的功能替代项?

镜像是 Azure Cosmos DB 中数据的低延迟复制。 与复制作业不同,镜像会创建 Azure Cosmos DB 数据的连续增量副本。 镜像不会影响源数据库或容器上的事务工作负荷。

相比之下,复制作业是计划作业,可为增量作业添加端到端延迟。 此外,复制作业要求管理以选取增量更改,在 Fabric 中添加计算成本,并影响 Azure Cosmos DB 中源数据库的请求单位消耗。

复制作业对 Azure Cosmos DB 中的一次性复制作业很有用,但镜像非常适合用于跟踪增量更改。

尝试镜像功能是否会影响 Azure Cosmos DB 帐户?

否,可以在源 Azure Cosmos DB 帐户或数据没有任何影响的情况下启用和禁用镜像。

警告

如果在 Azure Cosmos DB 帐户上启用连续备份以镜像到 Fabric,则无法禁用连续备份。 同样,如果启用了连续备份,则无法为 Azure Cosmos DB 帐户禁用分析存储。

Pricing

与镜像 Azure Cosmos DB 相关的成本是什么?

用于将 Cosmos DB 数据复制到 Fabric OneLake 的构造计算是免费的。 镜像存储成本取决于容量的限制。 有关详细信息,请参阅镜像和Microsoft构造定价的成本。 使用 SQL、Power BI 或 Spark 查询数据的计算按常规费率收费。

对于 Azure Cosmos DB,连续备份是镜像的先决条件。 如果在镜像之前启用了任何连续备份层,则不会产生任何额外费用。 如果专门为镜像启用连续备份,则 7 天备份模式是免费的;如果启用 30 天备份,系统会向你收取与该功能关联的价格。 有关详细信息,请参阅 Azure Cosmos DB 定价

如果使用数据资源管理器查看 Azure Cosmos DB 中的源数据,则会根据请求单位(RU)使用情况累算成本。

如何处理镜像 Azure Cosmos DB 的出口费用?

仅当 Azure Cosmos DB 帐户所在的区域与 Fabric 容量不同时,才会收取出口费用。 在 Azure Cosmos DB 帐户具有多个读取区域的情况下,Fabric 从地理上最近的 Azure 区域镜像到 Fabric 的容量区域。 有关详细信息,请参阅 复制限制

是否使用 Azure Cosmos DB 的分析存储进行镜像?

否,镜像不使用分析存储。 镜像不会影响事务工作负荷或吞吐量消耗。

在 Azure Cosmos DB 中,连续备份是镜像的先决条件。 此先决条件允许 Fabric 镜像数据,而不会影响事务工作负荷或需要分析存储。

否,Fabric 中的镜像与 Azure Synapse Link 无关。

在 Azure Cosmos DB 中,连续备份是镜像的先决条件。 此先决条件允许 Fabric 镜像数据,而不会影响事务工作负荷或需要分析存储。

否,Fabric 中的镜像与 Azure Synapse Link 无关。 在使用 Fabric 镜像时,可以继续使用 Azure Synapse Link。

在使用镜像时,是否可以继续使用 Azure Cosmos DB 的分析存储作为 Azure 数据工厂中的变更数据捕获 (CDC) 源?

可以,可以在同一 Azure Cosmos DB 帐户上使用分析存储和 Fabric 镜像。 这些功能彼此独立工作。 镜像不会干扰分析存储的使用。

是否可以在使用镜像时继续使用 Azure Cosmos DB 的更改源?

是的,可以在同一 Azure Cosmos DB 帐户上使用更改源和 Fabric 镜像。 这些功能彼此独立工作。 镜像不会干扰更改源的使用。

使用镜像后,是否可以为 Azure Cosmos DB 帐户禁用分析存储?

镜像需要 Azure Cosmos DB 连续备份作为先决条件。 启用了连续备份的 Azure Cosmos DB 帐户无法禁用分析存储。 在任何集合上禁用分析存储后,无法启用连续备份。 这是一个临时限制。

否,Azure Synapse Link 和 Azure Synapse Analytics 仍可用于工作负荷。 没有计划弃用这些工作负载。 可以继续对生产工作负荷使用 Azure Synapse Link。

数据连接和身份验证

如何管理 Azure Cosmos DB 的镜像连接?

在 Fabric 门户中,选择“设置”部分中的“管理连接和网关”选项。

允许 Azure Cosmos DB 帐户使用哪些身份验证方法?

仅支持读写帐户密钥和Microsoft Entra ID。

是否可以使用单一登录和基于角色的访问控制作为镜像 Azure Cosmos DB 的身份验证?

是的。 有关详细信息,请参阅 安全限制

是否可以将托管标识用作镜像 Azure Cosmos DB 的身份验证?

否,目前仅支持读写帐户密钥和Microsoft Entra ID。

如果轮换 Azure Cosmos DB 帐户密钥,会发生什么情况?

如果轮换了帐户密钥,则必须更新 Fabric 镜像的连接凭据。 如果未更新密钥,镜像将失败。 若要解决此故障,请停止复制,使用新轮换的密钥更新凭据,然后重启复制。

设置

是否可以在 Azure Cosmos DB 数据库中选择特定的容器进行镜像?

是的,从 Azure Cosmos DB 镜像数据库时,可以选择将哪些容器复制到 Fabric OneLake 中。 还可以随时为镜像项重新配置所选容器。

是否可以使用镜像多次复制单个 Azure Cosmos DB 数据库?

是的,多个镜像是可能的,但没有必要。 复制的数据位于 Fabric 中后,可以直接从 Fabric 将其共享到其他目标。

是否可以创建使用镜像创建的 Azure Cosmos DB 数据副本的快捷方式?

否,镜像不支持创建外部源的快捷方式,例如 Azure Data Lake Storage(ADLS) Gen2 或 Amazon Web Services (AWS) 简单存储服务 (S3)。

Azure Cosmos DB 数据资源管理器

在 Fabric 中,选择“查看”和“源数据库”时,我在 OneLake 或 Azure Cosmos DB 中看到数据?

构造中用于查看源数据库的选项使用数据资源管理器提供 Azure Cosmos DB 中实时数据的只读视图。 此透视是作为复制数据的源的容器的实时视图。

在 Fabric 门户中直接查看实时数据是一个有用的工具,用于确定与源 Azure Cosmos DB 数据库相比,OneLake 中的数据是最近还是正确表示。 使用实时 Azure Cosmos DB 数据上的数据资源管理器的作可能会累算请求单位消耗量。

Azure Cosmos DB 数据分析

如何分析镜像到 OneLake 中的 Azure Cosmos DB 数据?

使用 Fabric 门户针对 SQL 分析终结点创建新的 SQL 查询。 在这里,可以运行常见的查询,例如 SELECT TOP 100 * FROM ...

此外,使用 Lakehouse 与其他数据一起分析 OneLake 数据。 在 Lakehouse 中,可以利用 Spark 通过笔记本查询数据。

如何在 Azure Cosmos DB 的镜像中同步数据?

数据同步完全托管。 启用镜像时,数据几乎实时复制到 Fabric OneLake 中,镜像会在源数据库中发生时持续复制新更改。

Azure Cosmos DB 镜像是否适用于 Azure 和 Fabric 区域?

跨区域支持镜像,但此方案可能会导致意外的网络数据出口成本和延迟。 理想情况下,请将 Fabric 容量与某个 Azure Cosmos DB 帐户的区域匹配。 有关详细信息,请参阅 复制限制

Azure Cosmos DB 的镜像数据是否仅可使用 SQL 分析终结点?

可以在 Lakehouse 中将现有镜像数据库添加为快捷方式。 在 Lakehouse 中,可以直接浏览数据、在笔记本中打开 Spark 查询的数据或生成机器学习模型。

重要

Lakehouse 中的快捷方式是 镜像数据库的快捷方式,即 Azure Cosmos DB 数据的 OneLake 复制。 Lakehouse 中的快捷方式不会直接访问 Azure Cosmos DB 帐户或数据。

Azure Cosmos DB 数据的初始复制需要多长时间?

初始复制和连续复制的延迟因数据量而异。 在大多数情况下,延迟可能为几分钟,但对于大量数据,延迟可能更长。

复制 Azure Cosmos DB 插入、更新和删除作需要多长时间?

复制初始数据后,将近乎实时地复制各个作。 在极少数情况下,如果源数据库在时间范围内执行大量更新和删除作,则可能会有一点延迟。

镜像是否具有 Azure Cosmos DB 的内置退避逻辑?

否,镜像没有内置的退避逻辑,因为复制是连续的和增量的。

镜像是否支持 Azure Cosmos DB 中的更改数据馈送?

否,镜像目前不支持 Azure Cosmos DB 中的镜像数据上的更改数据馈送。

镜像是否支持从 Azure Cosmos DB 复制的数据的奖牌体系结构?

镜像没有对奖牌体系结构的内置支持。 可以使用水印逻辑配置自己的银层和黄金层,并使用管道或 Spark 进行转换和联接处理。

Power BI 报表是否对 Azure Cosmos DB 中的镜像数据使用直接湖模式?

是的。

Azure Cosmos DB 镜像是否支持嵌套数据?

是的,嵌套数据以 JSON 字符串形式平展在 OneLake 中。 使用OPENJSONCROSS APPLYOUTER APPLY平展视图的数据。 有关详细信息,请参阅 嵌套数据。 有关分步教程,请参阅 如何查询嵌套数据

Azure Cosmos DB 镜像是否支持自动平展。

否,镜像不会自动平展嵌套数据。 SQL 分析终结点可以使用嵌套 JSON 字符串。 有关详细信息,请参阅 嵌套数据

我是否应该关注 Azure Cosmos DB 中镜像数据的冷启动性能?

否,在 Fabric 中的一般 SQL 查询中,不会遇到冷启动延迟。

如果删除 Azure 中的源 Azure Cosmos DB 数据库,而该数据库正在镜像,会发生什么情况?

数据资源管理器和复制在 Fabric 中开始失败。 OneLake 数据将保持 as-is,直到删除现有的镜像数据。

镜像 Azure Cosmos DB 后,如何将 SQL 分析终结点连接到客户端工具或应用程序?

连接到镜像数据的 SQL 分析终结点类似于对 Fabric 中任何其他项使用相同的终结点。 有关详细信息,请参阅 连接到 Fabric 中的数据仓库

如何跨数据库联接 Azure Cosmos DB 镜像数据?

独立镜像每个 Azure Cosmos DB 数据库。 然后,将其中一个 SQL 分析终结点作为镜像数据库项添加到另一个终结点。 接下来,使用 SQL JOIN 查询在不同的 Azure Cosmos DB 数据库中跨容器执行查询。

如何将 Azure Cosmos DB 镜像数据与 Azure SQL 数据库或 Snowflake 数据联接?

镜像 Azure Cosmos DB 数据库。 然后,镜像 Azure SQL 数据库或 Snowflake 数据。 然后,将其中一个 SQL 分析终结点作为镜像数据库项添加到另一个终结点。 现在,使用 SQL JOIN 查询跨多个数据服务执行查询。

复制作

如何停止或禁用镜像 Azure Cosmos DB 数据库的复制?

使用 Fabric 门户的 停止复制 选项停止复制。 此作完全停止复制,但不会删除 OneLake 中已存在的任何数据。

如何重启镜像 Azure Cosmos DB 数据库的复制?

复制不支持 暂停恢复的概念。 停止复制完全停止复制,在 Fabric 门户中选择 重启复制 会完全从头开始复制。 重启复制会将 OneLake 数据替换为最新数据,而不是增量更新数据。

如何为镜像的 Azure Cosmos DB 数据库配置复制?

Fabric 门户包含用于配置特定复制选项的选项。

每个复制状态消息对复制的 Azure Cosmos DB 数据意味着什么?

最好是让复制状态为 “正在运行”。 如果复制状态为 “正在运行”并显示警告,则复制成功,但应该解决该问题。 “停止”、“已停止”、“失败”或“错误”状态表示需要干预才能继续复制的更严重状态。 有关详细信息,请参阅 Monitor Fabric 镜像

分析生存时间(TTL)或软删除

Azure Cosmos DB 的生存时间(TTL)功能是否从镜像数据库中删除了项?

是的,使用 TTL 删除的数据与使用 Azure Cosmos DB 中的删除作删除的数据的方式相同。 然后,从镜像数据库中删除数据。 镜像无法区分这些删除形式。

是否可以为 Azure Cosmos DB 中镜像的分析数据配置软删除?

删除作会立即复制到 OneLake。 目前无法配置软删除或分析生存时间(TTL)。

Azure Cosmos DB 镜像是否支持分析生存时间?

否,不支持分析生存时间。

访问 OneLake 数据

是否可以直接访问 Azure Cosmos DB 镜像生成的 OneLake 文件?

是的,可以使用文件或存储资源管理器直接访问 OneLake 文件。 还可以在 Databricks 中使用 OneLake 增量文件。 有关详细信息,请参阅 直接使用 OneLake 文件资源管理器访问 Fabric 数据 ,或 将 OneLake 与 Azure Databricks 集成

API 支持

是否可以以编程方式配置 Azure Cosmos DB 镜像?

是的,支持自动镜像配置可用。 若要详细了解 Microsoft Fabric 镜像 Rest API,请访问 此处的文档

内置持续集成或部署(CI/CD)是否可用于 Azure Cosmos DB 镜像?

否,目前不支持内置 CI/CD。

安全性

是否可以使用 Power BI 网关或防火墙访问 Azure Cosmos DB 镜像数据库?

否,目前不支持此级别的访问。

Azure Cosmos DB 镜像是否支持专用终结点?

否,目前不支持专用终结点。

Azure Cosmos DB 中的镜像数据是否离开我的 Fabric 租户?

否,数据保留在 Fabric 租户中。

Azure Cosmos DB 中的镜像数据是否存储在我的环境之外?

否,数据直接暂存到租户的 OneLake 中,并且不会暂存到环境之外。

许可

Azure Cosmos DB 镜像的许可选项是什么?

需要使用 Power BI Premium、Fabric 容量或试用容量许可才能使用镜像。

用户为 Azure Cosmos DB 数据创建和配置镜像需要哪些许可证?

有关许可的信息,请参阅 Fabric 许可证

用户需要哪些许可证才能使用 Azure Cosmos DB 中的镜像数据?

有关许可的信息,请参阅 Fabric 许可证