你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
下表列出了可用于 microsoft.kubernetesconfiguration/extensions 资源类型的所有指标。
表标题
指标 - Azure 门户中显示的指标名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
类别:延迟
| 指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
|---|---|---|---|---|---|---|
|
API 请求持续时间(以秒为单位) 请求持续时间直方图 |
ApiRequestDurationSeconds |
秒 | 平均值 |
AppName、、GpuEnabledMethod、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
| 引入时间 总引入时间(以分钟为单位) |
IngestionTimeMinutes |
秒 | 平均值 |
AppName、GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
输入预处理时间(毫秒) 输入预处理时间(以毫秒为单位) |
InputPreprocessingTimeMilliseconds |
毫秒 | 平均值 | GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
LLM 通话总时间(秒) call_llm 总时间(秒) |
TotalCallLLMTimeSeconds |
秒 | 平均值 |
AppName、、GpuEnabledLLMProvider、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
嵌入生成总时间(以秒为单位) 从本地模型生成嵌入所需的总时间 |
TotalGenerateEmbeddingsTimeSeconds |
秒 | 平均值 |
AppName、、GpuEnabledInputLength、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
混合搜索嵌入生成总时间(以秒为单位) 从本地模型生成混合搜索嵌入所用的总时间 |
TotalGenerateHybridSearchEmbeddingsTimeSeconds |
秒 | 平均值 |
AppName、、GpuEnabledInputLength、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
重新计算生成总时间(以秒为单位) 生成重排序所花费的总时间 |
TotalGenerateRerankingTimeSeconds |
秒 | 平均值 |
AppName、、GpuEnabledInputLength、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
获取聊天历史记录摘要总时间(以毫秒为单位) get_chat_history_summary 总时间(毫秒) |
TotalGetChatHistorySummaryTimeMilliseconds |
毫秒 | 平均值 |
AppName、GpuEnabled、InputHistoryPairs、LLMProvider、MaxTokens、OutputLength、Temperature、TopP |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
获取 LLM 有效负载总时间(以毫秒为单位) get_llm_payload 总时间(毫秒) |
TotalGetLLMPayloadTimeMilliseconds |
毫秒 | 平均值 |
AppName、DiversityPenalty、GpuEnabled、LengthPenalty、LLMProvider、MaxTokens、RepetitionPenalty、Temperature、TopP |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
获取混合搜索总时间(以毫秒为单位) 混合搜索总时间(以毫秒为单位) |
TotalHybridSearchTimeMilliseconds |
毫秒 | 平均值 |
AppName、ChunkMinScore、GpuEnabled、IndexType、InputLength、MetricType、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
推理总时间(以秒为单位) 总推理时间(以秒为单位) |
TotalInferenceTimeSeconds |
秒 | 平均值 |
AppName、DiversityPenalty、GpuEnabled、InputLength、LLMProvider、MaxTokens、OutputLength、RepetitionPenalty、Temperature、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
区块搜索总时间(以毫秒为单位) 总搜索区块时间(以毫秒为单位) |
TotalSearchChunksTimeMilliseconds |
毫秒 | 平均值 |
AppName、EmbeddingIndexName、GpuEnabled、InputLength、OutputChunks、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
搜索总时间(以毫秒为单位) 搜索所花费的总时间 |
TotalSearchTimeMilliseconds |
毫秒 | 平均值 |
AppName、ChunkMinScore、GpuEnabled、InputLength、QueryType、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
相似性搜索总时间(以毫秒为单位) 搜索类似文档所花费的总时间 |
TotalSimilaritySearchTimeMilliseconds |
毫秒 | 平均值 |
AppName、GpuEnabled、InputLength、ChunkMinScore、IndexType、MetricType、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
类别:交通
| 指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
|---|---|---|---|---|---|---|
|
活动的 PDU 会话 活动的 PDU 会话数目 |
ActiveSessionCount |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 否 |
|
API 失败计数 失败 API 请求数量 |
ApiFailureCount |
计数 | 计数 |
EndpointName、 GpuEnabled、、 StatusCode |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
API 请求计数 API 请求总数 |
ApiRequestCount |
计数 | 计数 |
AppName、、GpuEnabledMethod、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
API 成功计数 成功的 API 请求计数 |
ApiSuccessCount |
计数 | 计数 |
EndpointName、 GpuEnabled、、 StatusCode |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
身份验证尝试 身份验证尝试速率(每分钟) |
AuthAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
身份验证失败 身份验证失败率(每分钟) |
AuthFailure |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Result |
PT1M | 是 |
|
身份验证成功 身份验证成功率(每分钟) |
AuthSuccess |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
已连接的 NodeB 已连接的 gNodeB 或 eNodeB 数目 |
ConnectedNodebs |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
取消注册尝试 UE 取消注册尝试速率(每分钟) |
DeRegistrationAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
取消注册成功 UE 取消注册成功率(每分钟) |
DeRegistrationSuccess |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
评估 API 请求计数 评估 API 请求总数 |
EvaluationApiRequestCount |
计数 | 计数 |
AppName、 Method、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
失败/跳过计数 失败或跳过的文件计数 |
FailedSkippedCount |
计数 | 计数 |
Category、GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
文件引入速率 每个作业引入的文件总数 |
FileIngestionRate |
计数 | 总计(总和) |
AppName、、GpuEnabledFileType、、JobID |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
混合搜索模型 API 请求计数 混合搜索模型 API 请求总数 |
HybridSearchModelApiRequestCount |
计数 | 计数 |
AppName、 Method、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
推理结果反馈 推理答案反馈 |
InferenceAnswerFeedback |
计数 | 计数 |
AppName、ChunkMinScore、ChunkScores、GpuEnabled、LLMProvider、RunId、Thumb |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
推理 API 请求计数 推理 API 请求数 |
InferenceApiRequestCount |
计数 | 计数 |
AppName、 Method、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
引入 API 请求计数 引入 API 请求数 |
IngestionApiRequestCount |
计数 | 计数 |
AppName、 Method、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
评估次数 评估次数 |
NumberOfEvaluations |
计数 | 计数 |
AppName、、GpuEnabledMethod、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
作业数 作业数 |
NumberOfJobs |
计数 | 计数 |
AppName、、GpuEnabledMethod、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
分页尝试 分页尝试速率(每分钟) |
PagingAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
页面故障 分页失败速率(每分钟) |
PagingFailure |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
预配的订阅者 预配的订阅者数 |
ProvisionedSubscribers |
计数 | 总计(总和) |
PccpId、SiteId |
PT1M | 否 |
|
RAN 安装失败 RAN 安装失败率(每分钟) |
RanSetupFailure |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Cause |
PT1M | 是 |
|
RAN 安装请求 RAN 设置请求速率(每分钟) |
RanSetupRequest |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
RAN 安装响应 RAN 安装响应率(每分钟) |
RanSetupResponse |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
已注册订阅者 已注册订阅者数 |
RegisteredSubscribers |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
已连接的注册订阅者 已注册和连接的订阅者数 |
RegisteredSubscribersConnected |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
注册的订阅服务器空闲 已注册和空闲订阅者数 |
RegisteredSubscribersIdle |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
注册尝试 注册尝试速率(每分钟) |
RegistrationAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
注册失败 注册失败率(每分钟) |
RegistrationFailure |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Result |
PT1M | 是 |
|
注册成功 注册成功率(每分钟) |
RegistrationSuccess |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
服务请求尝试次数 服务请求尝试速率(每分钟) |
ServiceRequestAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
服务请求失败 服务请求失败率(每分钟) |
ServiceRequestFailure |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、Result、Tai |
PT1M | 是 |
|
服务请求成功 服务请求成功率(每分钟) |
ServiceRequestSuccess |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
会话建立尝试 PDU 会话建立尝试速率(每分钟) |
SessionEstablishmentAttempt |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Dnn |
PT1M | 是 |
|
会话建立失败 PDU 会话建立失败速率(每分钟) |
SessionEstablishmentFailure |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Dnn |
PT1M | 是 |
|
会话建立成功 PDU 会话建立成功率(每分钟) |
SessionEstablishmentSuccess |
计数 | 总计(总和) |
3gppGen、、PccpIdSiteId、、Dnn |
PT1M | 是 |
|
会话释放 会话释放速率(每分钟) |
SessionRelease |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
UE 上下文释放命令 UE 上下文释放命令消息速率(每分钟) |
UeContextReleaseCommand |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
UE 上下文释放完成 UE 上下文释放完成消息速率(每分钟) |
UeContextReleaseComplete |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
UE 上下文释放请求 UE 上下文释放请求消息速率(每分钟) |
UeContextReleaseRequest |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
用户平面带宽 用户平面带宽(以位/秒为单位)。 |
UserPlaneBandwidth |
比特每秒 | 总计(总和) |
PcdpId、、SiteIdDirection、、Interface |
PT1M | 否 |
|
用户平面数据包丢弃速率 用户平面数据包丢弃速率(数据包/秒) |
UserPlanePacketDropRate |
每秒计数 | 总计(总和) |
PcdpId、、SiteIdCause、Direction、Interface |
PT1M | 否 |
|
用户平面数据包速率 用户平面数据包速率(数据包数/秒) |
UserPlanePacketRate |
每秒计数 | 总计(总和) |
PcdpId、、SiteIdDirection、、Interface |
PT1M | 否 |
|
VectorDB API 请求计数 向 VectorDB 发出的 API 请求总数 |
VectorDbApiRequestCount |
计数 | 计数 |
AppName、 Method、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
|
Xn 切换尝试 切换尝试速率(每分钟) |
XnHandoverAttempt |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
Xn 切换失败 切换失败率(每分钟) |
XnHandoverFailure |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |
|
Xn 切换成功 切换成功率(每分钟) |
XnHandoverSuccess |
计数 | 总计(总和) |
3gppGen、 PccpId、、 SiteId |
PT1M | 是 |