Mosaic AI 模型服务提供高级工具,用于监视模型及其部署的质量和运行状况。 下表概述了可用的每个监视工具。
| 工具 | 描述 | 用途 | 访问 |
|---|---|---|---|
| 服务日志 | 从模型服务终结点捕获 stdout 和 stderr 流。 |
对模型部署期间的调试很有用。 使用 logging.warning(...) 或 logging.error(...) 立即显示在日志中。 |
可以使用 Serving UI 中的“日志”选项卡进行访问。 日志会实时流式传输,且可以通过 API 导出。 |
| 生成日志 | 显示来自会自动为模型服务终结点创建生产就绪型 Python 环境的进程的输出。 | 对诊断模型部署和依赖项问题很有用。 | 当模型服务生成完成时,显示在“日志”选项卡中的“生成日志”下。日志可以通过 API 导出。 这些日志最多保留 30 天(30 天)。 |
| 终结点运行状况指标 | 有助于深入了解延迟、请求率、错误率、CPU 使用情况和内存使用情况等基础结构指标。 | 对于了解 Serving 基础结构的性能和运行状况有重要影响。 | 过去 14 天在 Serving UI 中默认可用。 还可以实时将数据流式传输到可观测性工具。 |
| 已启用 AI 网关的推理表 | 对于为自定义模型、外部模型或预配吞吐量工作负荷提供服务的终结点,系统会自动将在线预测的请求和响应,记录到由 Unity Catalog 管理的 Delta 表中。 | 使用此工具监视和调试模型质量或响应、生成训练数据集或执行合规性审核。 | 通过 Serving UI 或 REST API 启用 AI 网关功能时,该选项可同时应用于现有及新增的模型服务终结点。 |