搜索看看
告警阈值、开关、规则在哪儿配置修改
1、在配置文件server/config/application.yml,如下部分就是系统内所有监控资源的全局告警配置,可以自定义修改配置
注意,以下配置文件中主机的传输速率、内存、cpu、磁盘、负载、连接数量的告警配置,适用于所有主机
2、
注意yml文件格式规则,每个配置项冒号后需要保留一个英文空格
,也可以用这个工具检测YML文件格式是否正确,
YAML、YML在线编辑(校验)工具
修改后,重启server生效
...... #告警缓存时间间隔(此时间段内同一告警通知不再重复发),单位秒,默认120分钟。此期间只是不推送告警到第三方(邮件钉钉微信等)了,系统监控扫描工作仍正常进行 warnCacheTimes: 7200 ...... #告警配置,策略优先级按照前后顺序执行,比如告警总开关关闭时,那下面所有告警开关都会失效 mail: #告警总开关,yes开启,no关闭 allWarnMail: yes #告警时间段cron表达式设置(在该时间段内发送告警,其他时间不发),默认为空会持续发送,如'* * 8-20 ? * MON-FRI'表示周1到周5的8点-20点发送告警,'* * 8-20 * * ?'表示每天的8点-20点发送告警,带单引号 warnCronTime: #主机上行传输速率bytes sent告警开关,yes开启,no关闭 upSpeedMail: yes #主机上行传输速率告警阈值,单位KB/s,默认10M,超过此值即发送告警 upSpeedVal: 10240 #主机上行传输速率低于此值时发送告警,此配置项一般不用,默认即可,单位KB/s,默认0MB upSpeedMinVal: 0 #主机下行传输速率bytes received告警开关,yes开启,no关闭 downSpeedMail: yes #主机下行传输速率告警阈值,单位KB/s,默认10M,超过此值即发送告警 downSpeedVal: 10240 #主机下行传输速率低于此值时发送告警,此配置项一般不用,默认即可,单位KB/s,默认0MB downSpeedMinVal: 0 #主机内存告警开关,yes开启,no关闭。总开关开启后,此处设置才会生效。以下开关均遵循此规则。 memWarnMail: yes #主机内存使用率%告警阈值,超过此值即发送告警,值可大于100 memWarnVal: 95 #主机内存使用率,连续几次超过阈值后发送告警通知,默认2次 memWarnCount: 2 #系统负载告警开关,yes开启,no关闭, sysLoadWarnMail: yes #系统负载告警值(以5分钟系统负载值为准进行告警),超过此值即发送告警 sysLoadWarnVal: 20 #主机CPU使用率告警开关,yes开启,no关闭 cpuWarnMail: yes #主机cpu使用率%告警阈值,超过此值即发送告警,值可大于100 cpuWarnVal: 95 #主机cpu使用率%,连续几次超过阈值后发送告警通知,默认2次 cpuWarnCount: 2 #CPU温度告警开关,yes开启,no关闭 cpuTemperatureWarnMail: no #cpu温度告警阈值℃,超过此值即发送告警 cpuTemperatureWarnVal: 92 #主机连接数量告警开关,yes开启,no关闭 netConnectionsWarnMail: no #主机连接数量告警阈值,超过此值即发送告警 netConnectionsWarnVal: 1000 #磁盘使用率告警开关,yes开启,no关闭 diskWarnMail: yes #磁盘使用率%告警值,超过此值即发送告警 diskWarnVal: 95 #不需要告警磁盘在此屏蔽,多个盘符用,隔开,如/boot,/dev。支持Ant路径匹配规则,如/dev/**。特殊符号用单引号,如'C:' diskBlock: /dev #不需要监控和保存的磁盘在此屏蔽,多个盘符用,隔开,如/boot,/dev。支持Ant路径匹配规则,如/dev/**。特殊符号用单引号,如'C:' diskBlockSave: #磁盘SMART健康检测告警开关,yes开启,no关闭 smartWarnMail: yes #主机下线告警开关,yes开启,no关闭 hostDownWarnMail: yes #进程下线告警,yes开启,no关闭 appDownWarnMail: yes #DOCKER下线告警,yes开启,no关闭 dockerDownWarnMail: yes #服务接口告警开关,yes开启,no关闭 heathWarnMail: yes #服务接口监测失败连续几次后发送告警通知,默认2次 heathWarnCount: 2 #ftp/sftp告警开关,yes开启,no关闭 ftpWarnMail: yes #数通设备PING告警,yes开启,no关闭 dceWarnMail: yes #数通设备PING监测失败连续几次后发送告警通知,默认2次 dceWarnCount: 2 #数通设备SNMP监测告警,yes开启,no关闭 snmpWarnMail: yes #数据源、数据表告警开关,yes开启,no关闭 dbDownWarnMail: yes #日志文件监控告警开关,yes开启,no关闭 fileLogWarnMail: yes #端口telnet不通告警开关,yes开启,no关闭 portWarnMail: yes #端口telnet不通,连续几次失败后发送告警通知,默认2次 portWarnCount: 2 #文件防篡改告警开关,yes开启,no关闭 fileSafeWarnMail: yes #指令下发通知开关,yes开启,no关闭 shellWarnMail: yes #自定义监控项告警开关,yes开启,no关闭 customInfoWarnMail: yes #服务器登录提醒通知开关,yes开启,no关闭,此功能需升级到专业版 hostLoginWarnMail: yes #主机mac地址变化告警开关,yes开启,no关闭,server配置文件默认没有此参数,如果需要关闭mac地址变化告警,可以添加此配置项 macInfoWarnMail: yes #告警脚本绝对路径(若配置脚本,无论是否配置过邮件,都会执行该脚本),可以为空,参考模板:server/template/sendMsg.sh warnScript: #告警恢复通知脚本绝对路径(若配置,则该脚本只会发送恢复消息,warnScript只会发送告警消息。若不配置该选项,则告警和恢复消息都会由warnScript脚本发送) recoverScript: #是否将告警内容转为unicode(针对告警脚本生效),yes是,no否,钉钉微信等告警建议设置为yes,windows部署server需设置为yes,否则接受到会是乱码 warnToUnicode: no #监控资源的告警级别,告警级别从高到底共3级:ERROR,WARN,INFO,如下是主机指标的告警级别配置,其他监控资源(如进程、端口、服务接口、数通监测、数据监测)的告警级别,可在编辑页面配置 level: #主机上行/下行传输速率的告警级别 speedWarn: WARN #主机连接数量的告警级别 netConnectionsWarn: WARN #主机内存使用率的告警级别 memWarn: WARN #主机系统负载的告警级别 sysLoadWarn: WARN #主机CPU使用率的告警级别 cpuWarn: WARN #主机CPU温度的告警级别 cpuTemperatureWarn: WARN #主机磁盘使用率的告警级别 diskWarn: WARN #主机磁盘SMART健康检测的告警级别 smartWarn: ERROR #主机下线的告警级别 hostDownWarn: ERROR #服务器登录提醒的告警级别 hostLoginWarn: INFO #指令下发的告警级别 shellWarn: INFO #设置系统发送告警通知的级别,指此级别或更高级别的资源出现故障,会发送告警通知 defaultWarn: INFO #是否将告警级别和标签添加到告警内容中,yes是,no否 addToWarnContent: yes
3、以上为适用所有主机的告警配置,
针对一个或多个主机的告警阈值配置,点击此处查看
告警配置视频讲解