1、修改下server的配置项,主机连续几次不上报数据后发送告警通知
在配置文件server/config/application.yml修改如下配置项,然后重启server程序即可
提示,此配置项需要升级到v3.5.7或者以上版本,才可以支持
注意,配置项冒号后需要保留一个英文空格,也可以用这个工具检测YML文件格式是否正确,YAML、YML在线编辑(校验)工具
2、修改下agent的上报时间监控频率,比如改成5分钟或10分钟上报一次,这样就会拉长判定周期,虽然监控频率会变慢 ,但是会提升准确度
在配置文件agent/config/application.properties修改如下配置项,然后重启agent即可
server有个内置任务,每5分钟运行一次判断主机是否下线,判定依据为该主机是否超过了上报频率时间并且没有上报监控数据
如果是的话,那么判定该主机下线
3、v3.5.3版本开始,新增了支持设置主机连续几次未上报监控数据,判定主机下线,我们可以在【自定义告警】模块对误报下线的主机进行设置,如下图
此值,默认不用填写,是空的,系统会每间隔5分钟扫描一次所有主机,默认只要主机超过一次周期不上报数据,就会判定主机下线