网络高峰期因为网络拥堵,会出现误报主机下线的情况,怎么延长判定周期

1、可以修改下agent的上报时间监控频率,比如改成5分钟或10分钟上报一次,这样就会拉长判定周期,虽然监控频率会变慢 ,但是会提升准确度
在配置文件agent/config/application.properties修改如下配置项,然后重启agent即可
server有个内置任务,每5分钟运行一次判断主机是否下线,判定依据为该主机是否超过了上报频率时间并且没有上报监控数据
如果是的话,那么判定该主机下线
2、v3.5.3版本开始,新增了支持设置主机连续几次未上报监控数据,判定主机下线,我们可以在【自定义告警】模块对误报下线的主机进行设置,如下图
此值,默认不用填写,是空的,系统会每间隔5分钟扫描一次所有主机,默认只要主机超过一次周期不上报数据,就会判定主机下线