Prometheus监控Linux

Linux 客户端安装docker 

export DOWNLOAD_URL="http://mirrors.163.com/docker-ce"
curl -fsSl https://get.docker.com/ |sh
apt install docker-compose -y

创建node-exporter

mkdir -p /data/docker-compose
cd /data/docker-compose

cat >docker-compose.yaml <<'EOF'
version: '3.3'
networks:
  monitoring:
    driver: bridge

services:
  node_exporter:
    image: prom/node-exporter:v1.5.0
    container_name: node-exporter
    restart: always
    volumes:
      - /etc/localtime:/etc/localtime:ro
      - /proc:/host/proc:ro
      - /sys:/host/sys:ro
      - /:/rootfs:ro
    command: 
      - '--path.procfs=/host/proc' 
      - '--path.sysfs=/host/sys'
      - '--collector.filesystem.ignored-mount-points=^/(sys|proc|dev|host|etc|rootfs/var/lib/docker)($$|/)'
    networks:
      - monitoring
    ports:
      - '9100:9100'
EOF

启动docker

docker-compose up -d

浏览器验证


http://ip:9100/metrics


 prometheus节点操作


 配置prometheeus/prometheus.yaml

  - job_name: 'node-exporter'
    scrape_interval: 15s
    static_configs:
    - targets: ['node_exporter:9100']
      labels:
        instance: Prometheus服务器 
    - targets: ['10.19.1.206:9100']
      labels:
        instance: 10.19.1.206服务器 
    - targets: ['10.19.1.220:9100']
      labels:
        instance: 10.19.1.220服务器

配置加载
curl -X POST http://localhost:9090/-/reload
检查容器状态
docker ps -a
docker logs -f node-exporter

CPU采集
node_cpu_seconds_total
node_cpu_seconds_total{ instance="10.19.1.220服务器"}
node_load1
node_load5
node_load15


内存采集
node_memory_MemTotal_bytes
node_memory_MemAvailable_bytes (free+buffer+cache)
node_memory_MemFree_bytes
node_memory_SwapFree_bytes
node_memory_SwapTotal_bytes


磁盘采集
node_disk_


文件系统采集
node_filesystem_

网络采集
node_network_
node_network_transmit_drop_total

增加触发器配置

cat >> prometheus/alert.yml <<'EOF'
- name: node-exporter
  rules:
  - alerts: HostOutOfMemory
    expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes * 100 < 10
	for: 2m
	labels:
	  severity: warning
	annotations:
	  summary: "主机内存不足,实例:{
  { $labels.instance }}"
	  description: "内存可用率<10%,当前值:{
  { $value }}"	  
  - alerts: HostMemoryUnderMemoryPressure
    expr: rate(node_vmstat_pgmajfault[1m]) > 1000
	for: 2m
	labels:
	  severity: warning
	annotations:
	  summary: "主机压力不足,实例:{
  { $labels.instance }}"
	  description: "节点内存压力大,重大页面错误率高,当前值:{
  { $value }}"   
  - alerts: HostUnusualNetworkThroughputIn
    expr: sum by (instance) (rate(node_network_receive_bytes_total[2m])) / 1024 / 1024 > 100
	for: 5m
	labels: 
	  severiry: warning
	annotations: 
	  summary: "异常流出网络吞吐量,实例: {
  { $labels.instance }}"
	  description: "网络流入量 > 100 MB/s,当前值: {
  { $value }}"  
  - alerts: HostUnusualDiskReadRate
    expr: sum by (instance) (rate(node_disk_read_bytes_total[2m])) / 1024 /1024 > 50
	for: 5m
	labels:
	  severity: warning
	annotations:
	  summary: "异常流出网络吞吐量,实例:{
  { $labels.instance }}"
	  description: "网络流出流量 > 100 MB/s,当前值: {
  { $value }}"
EOF
检查配置

docker exec -it prometheus promtool check config /etc/prometheus/prometheus.yml

grafana展示node-exporter的数据

相关推荐

  1. Prometheus监控Linux

    2024-01-01 04:26:02       39 阅读
  2. Linux上的监控工具:Zabbix、Prometheus、APM和ELK

    2024-01-01 04:26:02       6 阅读
  3. Prometheus监控nginx

    2024-01-01 04:26:02       36 阅读
  4. Prometheus监控mysql

    2024-01-01 04:26:02       37 阅读
  5. Prometheus监控redis

    2024-01-01 04:26:02       44 阅读
  6. Prometheus 监控docker

    2024-01-01 04:26:02       38 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-01 04:26:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-01 04:26:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-01 04:26:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-01 04:26:02       18 阅读

热门阅读

  1. vue3 key Attribute 的变化

    2024-01-01 04:26:02       40 阅读
  2. C++导论

    2024-01-01 04:26:02       30 阅读
  3. Django REST framework -10-自定义认证类

    2024-01-01 04:26:02       34 阅读
  4. 【WPF.NET开发】将路由事件标记为已处理和类处理

    2024-01-01 04:26:02       33 阅读
  5. 9、python-闭包

    2024-01-01 04:26:02       42 阅读
  6. 【PostgreSQL如何查看page、index的详细信息】

    2024-01-01 04:26:02       41 阅读
  7. 深入理解SqlSugar ORM框架的使用与实战

    2024-01-01 04:26:02       30 阅读
  8. 【Delphi 基础知识 8】常用的运算符

    2024-01-01 04:26:02       39 阅读
  9. 长度最小的子数组

    2024-01-01 04:26:02       37 阅读
  10. 数据库查询优化

    2024-01-01 04:26:02       39 阅读
  11. PostgreSQL | 概念 | 什么是OLTP&OLAP?

    2024-01-01 04:26:02       39 阅读
  12. 组合设计模式

    2024-01-01 04:26:02       33 阅读
  13. Ant Design Vue表单组件a-form-item-rest使用

    2024-01-01 04:26:02       39 阅读
  14. 如何将Git的语言设置为中文

    2024-01-01 04:26:02       40 阅读
  15. 腾讯云轻量应用服务器测评,2核4G5M配置3年756元

    2024-01-01 04:26:02       37 阅读
  16. 使用函数的选择法排序

    2024-01-01 04:26:02       38 阅读
  17. python的pandas数据分析处理基础学习

    2024-01-01 04:26:02       38 阅读
  18. MySQL中常用的数据类型

    2024-01-01 04:26:02       42 阅读
  19. Android获取电池充电状态是否为快充

    2024-01-01 04:26:02       37 阅读