将 Lakeflow 作业 添加为 Databricks Apps 的资源,以便您的应用可以触发、监控和管理工作流自动化。 Lakeflow 作业为数据处理工作负载提供任务编排,使你能够在应用中协调和运行多个任务,作为更大工作流的一部分。
添加作业资源
在将作业添加为应用资源之前,请检查是否满足 先决条件。
- 在创建或编辑应用时,在 “应用资源 ”部分中,单击“ + 添加资源”。 选择 “作业 ”作为资源类型。
- 从工作区中的可用作业中选择 Lakeflow 作业。
- 为应用选择适当的权限级别:
- 可以查看: 授予应用查看作业详细信息、运行历史记录和状态的权限。 将此用于仅监控的应用程序。
- 可以管理运行: 授予应用触发和取消作业运行的权限。
- 可以管理: 授予应用对作业的完整管理访问权限,包括编辑作业配置、任务和计划。
- (可选)指定自定义资源密钥,即在应用配置中引用作业的方式。 默认键为
job.
添加作业资源时,应用的服务主体获取所选作业的指定权限,以便应用可以根据授予的访问权限级别与工作流进行交互。
环境变量
使用 Lakeflow 作业资源部署应用时,Azure Databricks 会通过可以使用该字段引用的 valueFrom 环境变量公开作业 ID。
有关详细信息,请参阅 使用环境变量访问资源。
删除作业资源
从应用中删除 Lakeflow 作业资源时,应用的服务主体将失去对作业的访问权限。 作业本身保持不变,并继续可供具有适当权限的其他用户和应用程序使用。
应用启动的任何正在进行的作业运行将继续完成,但应用无法再触发新运行或访问作业详细信息。
最佳做法
使用 Lakeflow 作业资源时,请考虑以下事项:
- 授予最小权限。 监视应用程序使用
Can view,工作流编排使用Can manage run,仅当应用程序需要修改作业配置时使用Can manage。 - 在触发作业运行时,在应用中实现正确的错误处理和重试逻辑,因为作业可能因资源约束或数据问题而失败。
- 考虑应用与作业工作流之间的依赖关系。 将关键作业失败传达给应用用户。
- 使用作业参数使工作流可在不同的应用环境中配置和可重用。