常见安装和使用问题
1.server无法启动问题
注意:linux检查下面红框内的文件是否有可执行权限,若无,则赋给可执行权限,

最后,若还无法启动成功,可以看server/log/的日志文件有什么错误信息,一般错误信息都能百度到答案。

2.agent无法启动问题
linux检查下面红框内的文件是否有可执行权限,若无,则赋给可执行权限,

若还启动不了,查看下agent/log/日志文件里是否有错误信息。或执行./wgcloud-agent-release查看,是否下载对了和系统匹配的agent版本

3.登录慢,且登录后【监控概要】页面没有数字数据显示
这个问题是server没有连接上mysql数据库导致的,我们按照以下步骤排查
1.我们首先检查server/config/application.yml中mysql连接配置是否正确
2.再检查mysql是否已经启动(应先启动完mysql再启动server)
3.mysql是否允许其他IP访问
4.mysql是否已经创建了wgcloud数据库,并导入sql文件wgcloud.sql

4.server管理页面打开白板页面问题
查看下server/log日志文件里是否有错误信息,检测下server服务默认端口9999是否正常连通,是否有防火墙拦截端口,还有可能是其他安全软件设置过拦截过滤。

5.server管理页面打开404错误
一般是server的web管理页面url写错了,应该是http://101.34.81.144:9999/wgcloud,其中把101.34.81.144替换为自己的server主机实际IP。

6.server和agent都启动了,但是管理页面看不到监控主机,什么问题
这个一般是agent访问不通server,无法上报数据。
1.首先确认agent的serverUrl配置是否正确,然后在agent主机使用:telnet server的Ip 9999,测试server端的9999端口是否通着。一般都是端口不通导致的。
2.还有一种可能就是server连接不上mysql数据库,参考问题3说明

7.防篡改校验失败和防篡改校验错误次数大于10次的问题
这个问题注意几点:
1.server和agent的主机系统时间差不能大于14个小时,若时间差不超过14小时的时候打印【防篡改校验错误】类似信息,忽略即可
2.server主机的9997端口(这是守护进程wgcloud-daemon-release的默认端口)要开放给agent主机,保证agent主机可以telnet通server的9997端口,注意:v3.3.5开始9997端口已经不需要开放给agent
3.若是v3.3.5或以上版本,查看server本机是否能正常访问http://localhost:9997获得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主机的localhost不能使用,可以在配置文件server/config/application.yml,将配置项daemonUrl: http://localhost:9997 中的localhost改成server主机ip
4.wgcloud-server-release.jar不要修改
5.注意守护进程(wgcloud-daemon-release)不要关闭,查看此进程是否存活

8.支持mysql8.0版本吗
支持

9.JDK必须是1.8吗,支持JDK1.6,JDK11吗
不支持jdk1.6,推荐用JDK1.8,v3.3.5开始支持JDK11。若不想修改原JDK环境变量,可以修改start.sh,把jdk路径直接指到1.8的目录即可。OpenJDK1.8也支持。

10.WGCLOUD用什么语言开发的
server使用java,agent使用go。前端页面用bootstrap4

11.支持多节点部署吗
支持。有多少主机要监控,部署多少个agent,server只部署一个,所有agent都向这个server上报数据

12.登陆、点击菜单打开页面加载很慢
一般这种情况是server没有连接上mysql数据库导致的,检查下mysql配置是否配置正确,及server日志有无异常信息

13.gent需要连接数据库吗,agent主机需要连接外网吗
agent不用数据库。agent所在主机,只要能ping通server所在主机即可,不需要外网,也不需要开通端口。

14.[wgcloud-agent]2021/07/11 21:39:19 hostUtil.go:93: GetHostTemperatures err: 发生意外。 (不支持 )
这个错误忽略即可,对agent运行无影响。这是因为有些低版本操作系统或虚拟机,不支持获取CPU温度。

15.Cause: com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column 'FILE_STSTEM' at row 23 ; Data truncation: Data too long for column 'FILE_STSTEM' at row 23;
一般这个异常是盘符路径太长,解决办法:修改数据库表desk_state的FILE_STSTEM长度,改为100,如果不够再加长。碰到类似数据库列长度不够情况,修改下列长度即可

16.在哪儿添加监控主机啊?
监控主机会自动发现,无需添加。监控主机信息由agent自动上报,无需在server端管理页面添加主机,只要在agent配置文件设置好bindIp即可。

17.server和agent能部署到一台机器吗?

18.监控端口明明是通的,为什么显示状态失败
端口监控采用在监控主机telnet localhost 3306(这里3306只是例子说明)测试端口是否开通。请在监控主机telnet测试。有可能是映射端口,也有可能监控主机的localhost无法使用。v3.3.1已经支持在agent配置文件指定telnetIp,请升级修复此问题

19.监控超过100台主机时,调优技巧
当监控主机超过100台时,可以适当将wgcloud-server的内存调大,提升运算能力。具体修改wgcloud-server/start.sh,将-Xms256m -Xmx512m修改为-Xms1024m -Xmx1024m

20.windows启动server时候,启动窗口一闪而过,是什么问题
一般都是没有配置JDK1.8环境变量或配置不正确导致的,在start.bat里将java改为jdk绝对路径试一下。

21.如何查看运行错误信息
在server/log,agent/log,一般有问题可查看这两个文件夹下的日志文件信息。

22.页面添加时,遇到字符长度限制不够用,怎么处理
一般字段的长度都是经过深思熟虑设计的,足够用。如果确实有特殊情况,可以先随便保存一个不超长度的值,然后在数据库里修改对应表的字段长度和自己的实际值,即可

23.关于内存使用,没有计算cache说明
内存使用率 = (内存总大小-free-buffer/cache)/内存总大小*100

24.关于进程的cpu使用率过高说明
多核cpu主机,进程cpu使用率高时(>90%),是因为cpu使用率计算没有取cpu核数的平均值,这意味着在具有2个或多个逻辑CPU的系统上运行的繁忙循环进程可能被计算为具有100%的CPU利用率而不是50%,不过这种情况出现几率较小,即使出现也是很短暂

25.windows没有系统负载指标数据
windows本身没有系统负载指标,所以没有数据。linux有系统负载。v3.3.0版本开始windows已支持采集系统负载指标

26.centos5和REDHAT5,运行不了v3.0的agent
wgcloud从v3.0开始,agent使用go编写,go对linux要求为:内核版本2.6.23或更高版本,CentOS/RHEL 6.0以上,所以请升级下linux吧

27.支持微信钉钉短信告警吗
支持,在安装说明里有说明,微信告警钉钉告警,其他方式告警都可以仿照微信钉钉方式来实现

28.主机列表【删除】是什么意思
若是已下线主机,删除后,将不再告警,不会再出现在主机列表中,其下的监控数据资源(如历史数据、监控进程、监控端口、监控日志)不会被删。若是在线主机,删除后无影响,仅删除主机信息,其下的监控数据资源(如历史数据、监控进程、监控端口、监控日志)不会被删,一分钟后会自动发现主机

29.监控主机既有linux又有windows,可以server是linux版本,agent采用windows和linux版本吗
可以,server可以部署在linux,agent可以部署在windows也可以部署在linux,同样server部署在windows上,agent可以部署在linux上也可以部署在windows,只要保持同一个版本就行

30.需要安装tomcat吗
不需要

31.守护进程的9997端口可以修改吗,不启动守护进程有什么影响
可以修改,请查看,如何修改守护进程端口

32.logo和软件名称为什么设置后,没有生效
此功能为专业版功能,请先确认是否已经是专业版。然后记得先修改server/config/application.yml里的logo相关配置项,另外请注意,ico格式需为png,ico暂时不支持。注意,将自己的logo图片,都放到server/logo目录下,配置文件里写错了,不是server/images

33.监控指标出现-1.0代表什么
负值代表监控资源不存在,不支持,或获取指标失败,可以查看agent/log/下的日志有没有错误信息

34.日志文件监控多长时间扫描一次
默认10分钟,可以在agent/config/application.properties里修改

35.监控主机故障后,server多长时间检测到该主机已下线并发送告警
5分钟

36.添加监控进程、端口、docker、日志后,多长时间能采集到指标数据
agent端5分钟内同步监控资源数据,之后按照agent的上报频率来上报采集数据

37.主机查看图表,点击【全天】页面加载慢问题
点击【全天】页面渲染慢,是因为此图表页面加载数据过多导致,可稍等一会就好,agent上报频率越快,该主机每天产生数据越多。建议非特殊监控主机,agent设置上报时间不要小于60秒

38.进程流量指标是怎么获取的
取自Linux目录/proc/[pid]/io

39.license能更换服务器再使用吗
可以。但一个授权文件只能被一台主机的一个server使用。如不满足使用,请购买适当数量的授权文件

40.wgcloud能在内网运行吗
可以

41.大屏展板会自动刷新吗
会,每10分钟自动刷新一次。大屏展板不需要登陆就可以浏览

42.进程监控添加,进程启动路径的关键字是什么意思
就是进程启动CMD的关键字符,保证唯一匹配进程即可,具体说明请查看,进程监控使用说明

43.进程监控列表的读取和写入指标是什么意思
读取:从磁盘读取的字节数(累积)。写入:从磁盘写入的字节数(累积)。始终-1在BSD上。负值代表进程不存在或已下线。

44.java.lang.IllegalStateException: Clock moved backwards. Refusing to generate id for 48240ms
这个异常错误是因为server所在服务器系统时间倒退导致的,一般重启server就可以自动恢复。

45.【监控概要】页面的磁盘容量总和不准确是什么原因
磁盘容量总和是统计所有主机的磁盘容量之和,系统会每小时自动刷新一次,因此看到的数据延迟