Prometheus监控运维实战十：主机监控指标

cc • 2021-12-04 22:12 • 好物分享

在上一篇文章中我们学习了如何通过node-exporter获取主机监控信息。但安装好监控只是第一步，我们还需要知道哪些监控指标是我们需要关注的。
本文将对Prometheus相关的主机监控指标进行介绍。
一. CPU监控
CPU负载
node_load1
node_load5
node_load15
以上三个指标为主机的CPU平均负载，分别对应一分钟、五分钟和十五分钟的时间间隔。CPU负载是指某段时间内占用CPU时间的进程和等待CPU时间的进程数之和。一般来说，cpu负载数/cpu核数如果超过0.7，应该开始关注机器性能情况，如果超过1的话，运维人员应该介入处理。
CPU使用率
node_cpu_seconds_total
该指标包括了多个标签，分别标记每种处理模式使用的CPU时间，该指标为counter类型。这个指标不适合直接拿来使用，可通过前面学习的PromQL，将其转化成CPU使用率的指标。

mode="idle"代表CPU 的空闲时间，所以我们只需要算出空闲的时间占比，再以总数减去该值，便可知道CPU的使用率

Prometheus监控运维实战十：主机监控指标最先出现在Python成神之路。

版权声明：
作者：cc
链接：https://www.techfm.club/p/7538.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

WPF 不遮挡任务栏最大化和全屏显示

< <上一篇

【排错】光纤故障处理思路

下一篇>>

搜索内容

Prometheus监控运维实战十：主机监控指标

取消回复

共有 0 条评论

Ads

Prometheus监控运维实战十： 主机监控指标

取消回复

共有 0 条评论

Ads

Prometheus监控运维实战十：主机监控指标