常规的k8s的监控指标

常规的监控指标

1、集群维度

  • 集群状态
  • 集群节点数
  • 节点状态(正常、不可达、未知)
  • 节点的资源使用率(CPU、内存、IO等)

2、应用维度

  • 应用响应时间

  • 应用的错误率

  • 应用的请求量

3、系统和集群组件维度

  • API服务器状态
  • 控制器状态
  • etcd状态

常用的 Prometheus Operator 指标

常用监控 Kubernetes 性能的 Prometheus Operator 指标 如下:

  1. Kubernetes 资源相关
  2. Kubernetes 存储相关
  3. kubernetes system 相关
  4. APIServer 相关
  5. kubelet 相关
  6. 集群组件
  7. 应用相关
  8. 节点相关
  9. Etcd 相关
  10. CoreDNS 相关

1、Kubernetes 资源相关

CPUThrottlingHigh

关于 CPU 的 limit 合理性指标。查出最近5分钟,超过25%的 CPU 执行周期受到限制的容器。表达式:

sum(increase(container_cpu_cfs_throttled_periods_total{container!="", }[5m])) by (container, pod, namespace) /sum(increase(container_cpu_cfs_periods_total{}[5m])) by (co

相关推荐

  1. 常规k8s监控指标

    2024-04-06 03:12:04       39 阅读
  2. k8s部署管理以及prometheus相关监控

    2024-04-06 03:12:04       66 阅读
  3. K8S学习指南(48)-k8spod驱逐

    2024-04-06 03:12:04       53 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-06 03:12:04       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-06 03:12:04       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-06 03:12:04       87 阅读
  4. Python语言-面向对象

    2024-04-06 03:12:04       96 阅读

热门阅读

  1. Spring注入方式解析与实践

    2024-04-06 03:12:04       34 阅读
  2. Python笔记|列表推导式

    2024-04-06 03:12:04       41 阅读
  3. 设计模式:原型模式

    2024-04-06 03:12:04       43 阅读
  4. deepspeed学习-多机all_reduce

    2024-04-06 03:12:04       31 阅读
  5. Kubernetes学习笔记6

    2024-04-06 03:12:04       42 阅读
  6. 威胁建模与网络安全测试方法

    2024-04-06 03:12:04       42 阅读
  7. 2024.3.24力扣每日一题——零钱兑换

    2024-04-06 03:12:04       35 阅读
  8. 2024/4/2 HarmonyOS学习笔记一TS数据类型

    2024-04-06 03:12:04       36 阅读