监控系统自监控怎么做

问题

监控系统用于监控其他的系统、基础设施,绝对是P0级的服务,那监控系统的自监控应该怎么做呢?如果自己监控自己,有些组件挂掉了难免循环依赖,如果单独搞一套新的监控系统来监控当前服役的监控系统,又搞得有些过于复杂。本文我们来探讨一下监控系统的自监控应该怎么做。

解决方案:自身指标

首先,监控系统自身是会暴露监控指标的,比如Prometheus、VictoriaMetrics、Nightingale,都通过/metrics接口暴露了自身的监控指标,这些指标通过监控系统自身的采集机制去采集就好,相关数据的历史趋势图、告警规则,也在监控系统自身配置好,只要自身模块没有挂掉,或者没有全部挂掉,相关数据基本都可以正常使用。

比如Nightingale的自身监控指标,可以通过categraf的input.prometheus插件来采集,即conf/input.prometheus/prometheus.toml的内容如下:

[[instances]]urls=["



转载请注明地址:http://www.jiankongxingye.com/jkrj/26848189.html
  • 上一篇文章:
  • 下一篇文章: 没有了