Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
I den här artikeln visas standardmålen, instrumentpanelerna och inspelningsreglerna när du konfigurerar Prometheus-mått som ska hämtas från ett AKS-kluster (Azure Kubernetes Service) eller Azure Arc-aktiverad Kubernetes.
Minimal inmatningsprofil
Minimal ingestion profile är en inställning som hjälper till att minska inmatningsvolymen av mått, eftersom endast mått som används av standardinstrumentpaneler, standardregistreringsregler och standardaviseringar samlas in. För addon-baserad samling Minimal ingestion profile är inställningen aktiverad som standard. Du kan ändra samlingen så att du kan samla in fler mått enligt nedan.
Skrapfrekvens
Standardfrekvensen för skrapning för alla standardmål och skrapsår är 30 sekunder.
Mål som har skrapats som standard
Följande mål är aktiverade/PÅ som standard , vilket innebär att du inte behöver ange någon konfiguration av skrapjobb för att skrapa dessa mål, eftersom måtttillägget skrapar dessa mål automatiskt som standard.
-
cadvisor(job=cadvisor) -
nodeexporter(job=node) -
kubelet(job=kubelet) -
kube-state-metrics(job=kube-state-metrics) -
networkobservabilityRetina(job=networkobservabilityRetina)
När du aktiverar funktionen för mätningar av kontrollplan (förhandsgranskning), är följande mål aktiverade. Du kan använda kontrollplansmått för att maximera den övergripande observerbarheten och upprätthålla driftskvalitet för ditt AKS-kluster. Mer information finns i Kontrollplansmått (förhandsversion).
-
controlplane-apiserver(job=controlplane-apiserver) -
controlplane-etcd(job=controlplane-etcd)
Följande mål är aktiverade/PÅ när du aktiverar containernätverksobservabilitet, vilket är en funktion i Advanced Container Networking Services-paketet och är kompatibelt med alla Linux-arbetsbelastningar som sömlöst integreras med Hubble för både Cilium- eller icke-Cilium-baserade dataplanet. Detta ger flexibilitet för dina containernätverksbehov. Mer information finns i Advanced Container Networking Services.
-
networkobservabilityHubble(job=networkobservabilityHubble) -
networkobservabilityCilium(job=networkobservabilityCilium)
Följande mål aktiveras/PÅ när du aktiverar Azure Container Storage, som är en molnbaserad volymhanterings-, distributions- och orkestreringstjänst som skapats internt för containrar och integreras internt med AKS. Mer information finns i Azure Container Storage.
-
acstor-capacity-provisioner(job=acstor-capacity-provisioner) -
acstor-metrics-exporter(job=acstor-metrics-exporter)
Mått som samlas in från standardmål
Följande mått samlas in som standard från varje standardmål. Alla andra mått tas bort genom omklassificeringsregler.
cadvisor (job=cadvisor)
container_spec_cpu_periodcontainer_spec_cpu_quotacontainer_cpu_usage_seconds_totalcontainer_memory_rsscontainer_network_receive_bytes_totalcontainer_network_transmit_bytes_totalcontainer_network_receive_packets_totalcontainer_network_transmit_packets_totalcontainer_network_receive_packets_dropped_totalcontainer_network_transmit_packets_dropped_totalcontainer_fs_reads_totalcontainer_fs_writes_totalcontainer_fs_reads_bytes_totalcontainer_fs_writes_bytes_totalcontainer_memory_working_set_bytescontainer_memory_cachecontainer_memory_swapcontainer_cpu_cfs_throttled_periods_totalcontainer_cpu_cfs_periods_totalkubernetes_build_info"
kubelet (job=kubelet)
kubelet_volume_stats_used_byteskubelet_node_namekubelet_running_podskubelet_running_pod_countkubelet_running_containerskubelet_running_container_countvolume_manager_total_volumeskubelet_node_config_errorkubelet_runtime_operations_totalkubelet_runtime_operations_errors_total-
kubelet_runtime_operations_duration_secondskubelet_runtime_operations_duration_seconds_bucketkubelet_runtime_operations_duration_seconds_sumkubelet_runtime_operations_duration_seconds_count -
kubelet_pod_start_duration_secondskubelet_pod_start_duration_seconds_bucketkubelet_pod_start_duration_seconds_sumkubelet_pod_start_duration_seconds_count -
kubelet_pod_worker_duration_secondskubelet_pod_worker_duration_seconds_bucketkubelet_pod_worker_duration_seconds_sumkubelet_pod_worker_duration_seconds_count -
storage_operation_duration_secondsstorage_operation_duration_seconds_bucketstorage_operation_duration_seconds_sumstorage_operation_duration_seconds_count storage_operation_errors_total-
kubelet_cgroup_manager_duration_secondskubelet_cgroup_manager_duration_seconds_bucketkubelet_cgroup_manager_duration_seconds_sumkubelet_cgroup_manager_duration_seconds_count -
kubelet_pleg_relist_duration_secondskubelet_pleg_relist_duration_seconds_bucketkubelet_pleg_relist_duration_sumkubelet_pleg_relist_duration_seconds_count -
kubelet_pleg_relist_interval_secondskubelet_pleg_relist_interval_seconds_bucketkubelet_pleg_relist_interval_seconds_sumkubelet_pleg_relist_interval_seconds_count rest_client_requests_total-
rest_client_request_duration_secondsrest_client_request_duration_seconds_bucketrest_client_request_duration_seconds_sumrest_client_request_duration_seconds_count process_resident_memory_bytesprocess_cpu_seconds_totalgo_goroutineskubelet_volume_stats_capacity_byteskubelet_volume_stats_available_byteskubelet_volume_stats_inodes_usedkubelet_volume_stats_inodeskubernetes_build_info"
nodexporter (job=node)
node_cpu_seconds_totalnode_memory_MemAvailable_bytesnode_memory_Buffers_bytesnode_memory_Cached_bytesnode_memory_MemFree_bytesnode_memory_Slab_bytesnode_memory_MemTotal_bytesnode_netstat_Tcp_RetransSegsnode_netstat_Tcp_OutSegsnode_netstat_TcpExt_TCPSynRetransnode_load1``node_load5node_load15node_disk_read_bytes_totalnode_disk_written_bytes_totalnode_disk_io_time_seconds_totalnode_filesystem_size_bytesnode_filesystem_avail_bytesnode_filesystem_readonlynode_network_receive_bytes_totalnode_network_transmit_bytes_totalnode_vmstat_pgmajfaultnode_network_receive_drop_totalnode_network_transmit_drop_totalnode_disk_io_time_weighted_seconds_totalnode_exporter_build_infonode_time_secondsnode_uname_info"
kube-state-metrics (job=kube-state-metrics)
kube_job_status_succeededkube_job_spec_completionskube_daemonset_status_desired_number_scheduledkube_daemonset_status_number_readykube_deployment_status_replicas_readykube_pod_container_status_last_terminated_reasonkube_pod_container_status_waiting_reasonkube_pod_container_status_restarts_totalkube_node_status_allocatablekube_pod_ownerkube_pod_container_resource_requestskube_pod_status_phasekube_pod_container_resource_limitskube_replicaset_ownerkube_resourcequotakube_namespace_status_phasekube_node_status_capacitykube_node_infokube_pod_infokube_deployment_spec_replicaskube_deployment_status_replicas_availablekube_deployment_status_replicas_updatedkube_statefulset_status_replicas_readykube_statefulset_status_replicaskube_statefulset_status_replicas_updatedkube_job_status_start_timekube_job_status_activekube_job_failedkube_horizontalpodautoscaler_status_desired_replicaskube_horizontalpodautoscaler_status_current_replicaskube_horizontalpodautoscaler_spec_min_replicaskube_horizontalpodautoscaler_spec_max_replicaskubernetes_build_infokube_node_status_conditionkube_node_spec_taintkube_pod_container_info-
kube_resource_labels(t.ex. - kube_pod_labels, kube_deployment_labels) -
kube_resource_annotations(t.ex. - kube_pod_annotations, kube_deployment_annotations)
controlplane-apiserver (job=controlplane-apiserver)
apiserver_request_totalapiserver_cache_list_fetched_objects_totalapiserver_cache_list_returned_objects_totalapiserver_flowcontrol_demand_seats_averageapiserver_flowcontrol_current_limit_seatsapiserver_request_sli_duration_seconds_bucket{le=+inf}apiserver_request_sli_duration_seconds_countapiserver_request_sli_duration_seconds_sumprocess_start_time_secondsapiserver_request_duration_seconds_bucket{le=+inf}apiserver_request_duration_seconds_countapiserver_request_duration_seconds_sumapiserver_storage_list_fetched_objects_totalapiserver_storage_list_returned_objects_totalapiserver_current_inflight_requests
Anmärkning
apiserver_request_duration_seconds och apiserver_request_sli_duration_seconds är histogrammått som har hög kardinalitet och alla serier samlas inte in som standard (minimal inmatningsprofil). Endast summan, antalet används för att samla in genomsnittliga svarstider
controlplane-etcd (job=controlplane-etcd)
etcd_server_has_leaderrest_client_requests_totaletcd_mvcc_db_total_size_in_bytesetcd_mvcc_db_total_size_in_use_in_bytesetcd_server_slow_read_indexes_totaletcd_server_slow_apply_totaletcd_network_client_grpc_sent_bytes_totaletcd_server_heartbeat_send_failures_total
networkobservabilityHubble (job=networkobservabilityHubble), och networkobservabilityCilium (job=networkobservabilityCilium)
En lista över mått som samlas in av dessa mål finns i Observabilitetsmått för containernätverk
acstor-capacity-provisioner (job=acstor-capacity-provisioner) och acstor-metrics-exporter (job=acstor-metrics-exporter)
För en lista över de mått som dessa målgrupper samlar in, se Azure Container Storage-mått.
Förvalda mål skrapade för Windows
Följande Windows-mål är konfigurerade för skrapning, men skrapning är inte aktiverad (inaktiverad/AV) som standard, vilket innebär att du inte behöver ange någon konfiguration för skrapjobben för dessa mål. De är dock inaktiverade/AV som standard och du måste slå på/aktivera skrapning för dessa mål med hjälp av ama-metrics-settings-configmap under default-scrape-settings-enabled avsnittet.
Två standardjobb kan köras för Windows som skrapar metriker som krävs för instrumentpanelerna som är specifika för Windows.
-
windows-exporter(job=windows-exporter) -
kube-proxy-windows(job=kube-proxy-windows)
Anmärkning
Detta kräver att du tillämpar eller uppdaterar konfigurationskartan ama-metrics-settings-configmap och installerar windows-exporter på alla Windows-noder. Mer information finns i aktiveringsdokumentet.
Mätvärden insamlade för Windows
Följande mått samlas in när windows-exporter och kube-proxy-windows är aktiverade.
windows-exporter (job=windows-exporter)
windows_system_system_up_timewindows_cpu_time_totalwindows_memory_available_byteswindows_os_visible_memory_byteswindows_memory_cache_byteswindows_memory_modified_page_list_byteswindows_memory_standby_cache_core_byteswindows_memory_standby_cache_normal_priority_byteswindows_memory_standby_cache_reserve_byteswindows_memory_swap_page_operations_totalwindows_logical_disk_read_seconds_totalwindows_logical_disk_write_seconds_totalwindows_logical_disk_size_byteswindows_logical_disk_free_byteswindows_net_bytes_totalwindows_net_packets_received_discarded_totalwindows_net_packets_outbound_discarded_totalwindows_container_availablewindows_container_cpu_usage_seconds_totalwindows_container_memory_usage_commit_byteswindows_container_memory_usage_private_working_set_byteswindows_container_network_receive_bytes_totalwindows_container_network_transmit_bytes_total
kube-proxy-windows (job=kube-proxy-windows)
kubeproxy_sync_proxy_rules_duration_secondskubeproxy_sync_proxy_rules_duration_seconds_bucketkubeproxy_sync_proxy_rules_duration_seconds_sumkubeproxy_sync_proxy_rules_duration_seconds_countrest_client_requests_totalrest_client_request_duration_secondsrest_client_request_duration_seconds_bucketrest_client_request_duration_seconds_sumrest_client_request_duration_seconds_countprocess_resident_memory_bytesprocess_cpu_seconds_totalgo_goroutines
Översiktspaneler
Följande standardinstrumentpaneler etableras och konfigureras automatiskt av Azure Monitor-hanterad tjänst för Prometheus när du länkar din Azure Monitor-arbetsyta till en Azure Managed Grafana-instans. Källkoden för dessa instrumentpaneler finns på den här GitHub-lagringsplatsen. Instrumentpanelerna nedan etableras i den angivna Azure Grafana-instansen under Managed Prometheus mappen i Grafana. Det här är standardinstrumentpaneler inom open source-gemenskapen för övervakning av Kubernetes-kluster med Prometheus och Grafana.
Kubernetes / Compute Resources / ClusterKubernetes / Compute Resources / Namespace (Pods)Kubernetes / Compute Resources / Node (Pods)Kubernetes / Compute Resources / PodKubernetes / Compute Resources / Namespace (Workloads)Kubernetes / Compute Resources / WorkloadKubernetes / KubeletNode Exporter / USE Method / NodeNode Exporter / NodesKubernetes / Compute Resources / Cluster (Windows)Kubernetes / Compute Resources / Namespace (Windows)Kubernetes / Compute Resources / Pod (Windows)Kubernetes / USE Method / Cluster (Windows)Kubernetes / USE Method / Node (Windows)
Inspelningsregler
Följande standardregler för inspelning konfigureras automatiskt av Azure Monitor-hanterad tjänst för Prometheus när du konfigurerar Prometheus-mått som ska skrapas från ett AkS-kluster (Azure Kubernetes Service). Källkoden för dessa inspelningsregler finns på den här GitHub-lagringsplatsen. Det här är standardreglerna för registrering med öppen källkod som används i instrumentpanelerna ovan.
cluster:node_cpu:ratio_rate5mnamespace_cpu:kube_pod_container_resource_requests:sumnamespace_cpu:kube_pod_container_resource_limits:sum:node_memory_MemAvailable_bytes:sumnamespace_memory:kube_pod_container_resource_requests:sumnamespace_memory:kube_pod_container_resource_limits:sumnamespace_workload_pod:kube_pod_owner:relabelnode_namespace_pod_container:container_cpu_usage_seconds_total:sum_iratecluster:namespace:pod_cpu:active:kube_pod_container_resource_requestscluster:namespace:pod_cpu:active:kube_pod_container_resource_limitscluster:namespace:pod_memory:active:kube_pod_container_resource_requestscluster:namespace:pod_memory:active:kube_pod_container_resource_limitsnode_namespace_pod_container:container_memory_working_set_bytesnode_namespace_pod_container:container_memory_rssnode_namespace_pod_container:container_memory_cachenode_namespace_pod_container:container_memory_swapinstance:node_cpu_utilisation:rate5minstance:node_load1_per_cpu:ratioinstance:node_memory_utilisation:ratioinstance:node_vmstat_pgmajfault:rate5minstance:node_network_receive_bytes_excluding_lo:rate5minstance:node_network_transmit_bytes_excluding_lo:rate5minstance:node_network_receive_drop_excluding_lo:rate5minstance:node_network_transmit_drop_excluding_lo:rate5minstance_device:node_disk_io_time_seconds:rate5minstance_device:node_disk_io_time_weighted_seconds:rate5minstance:node_num_cpu:sumnode:windows_node:sumnode:windows_node_num_cpu:sum:windows_node_cpu_utilisation:avg5mnode:windows_node_cpu_utilisation:avg5m:windows_node_memory_utilisation::windows_node_memory_MemFreeCached_bytes:sumnode:windows_node_memory_totalCached_bytes:sum:windows_node_memory_MemTotal_bytes:sumnode:windows_node_memory_bytes_available:sumnode:windows_node_memory_bytes_total:sumnode:windows_node_memory_utilisation:rationode:windows_node_memory_utilisation:node:windows_node_memory_swap_io_pages:irate:windows_node_disk_utilisation:avg_iratenode:windows_node_disk_utilisation:avg_iratenode:windows_node_filesystem_usage:node:windows_node_filesystem_avail::windows_node_net_utilisation:sum_iratenode:windows_node_net_utilisation:sum_irate:windows_node_net_saturation:sum_iratenode:windows_node_net_saturation:sum_iratewindows_pod_container_availablewindows_container_total_runtimewindows_container_memory_usagewindows_container_private_working_set_usagewindows_container_network_received_bytes_totalwindows_container_network_transmitted_bytes_totalkube_pod_windows_container_resource_memory_requestkube_pod_windows_container_resource_memory_limitkube_pod_windows_container_resource_cpu_cores_requestkube_pod_windows_container_resource_cpu_cores_limitnamespace_pod_container:windows_container_cpu_usage_seconds_total:sum_rate
Inspelningsregler för Prometheus-visualisering
När du använder Prometheus-baserade Container Insights distribueras fler inspelningsregler för att stödja Prometheus-visualiseringarna.
ux:cluster_pod_phase_count:sumux:node_cpu_usage:sum_irateux:node_memory_usage:sumux:controller_pod_phase_count:sumux:controller_container_count:sumux:controller_workingset_memory:sumux:controller_cpu_usage:sum_irateux:controller_rss_memory:sumux:controller_resource_limit:sumux:controller_container_restarts:maxux:pod_container_count:sumux:pod_cpu_usage:sum_irateux:pod_workingset_memory:sumux:pod_rss_memory:sumux:pod_resource_limit:sumux:pod_container_restarts:maxux:node_network_receive_drop_total:sum_irateux:node_network_transmit_drop_total:sum_irate
Följande inspelningsregler krävs för Windows-stöd. Dessa regler distribueras tillsammans med ovanstående regler, men de är inte aktiverade som standard. Följ anvisningarna för att aktivera och inaktivera regelgrupper på din Azure Monitor-arbetsyta.
ux:node_cpu_usage_windows:sum_irateux:node_memory_usage_windows:sumux:controller_cpu_usage_windows:sum_irateux:controller_workingset_memory_windows:sumux:pod_cpu_usage_windows:sum_irateux:pod_workingset_memory_windows:sum