常规的k8s的监控指标

2024-04-06 03:12:04
开发
38

常规的监控指标

1、集群维度

集群状态
集群节点数
节点状态（正常、不可达、未知）
节点的资源使用率（CPU、内存、IO等）

2、应用维度

应用响应时间
应用的错误率
应用的请求量

3、系统和集群组件维度

API服务器状态
控制器状态
etcd状态

常用的 Prometheus Operator 指标

常用监控 Kubernetes 性能的 Prometheus Operator 指标如下：

Kubernetes 资源相关

Kubernetes 存储相关

kubernetes system 相关

APIServer 相关

kubelet 相关

集群组件

应用相关

节点相关

Etcd 相关

CoreDNS 相关

1、Kubernetes 资源相关

CPUThrottlingHigh

关于 CPU 的 limit 合理性指标。查出最近5分钟，超过25%的 CPU 执行周期受到限制的容器。表达式：

sum(increase(container_cpu_cfs_throttled_periods_total{container!="", }[5m])) by (container, pod, namespace) /sum(increase(container_cpu_cfs_periods_total{}[5m])) by (co

原文地址:https://blog.csdn.net/knight_zhou/article/details/137403158 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1776326958876069888.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部