进程应用、中间件监测使用说明(对我们关注的业务系统、中间件、进程进行实时监测)
进程监控是一个通用功能模块,可以监控任何中间件、业务进程,我们目前没有对tomcat等中间件做定制指标监控,都是通过进程监控来实现监控这些进程的
进程监控可以采集进程的PID、启动时间、吞吐量、所有者、cpu使用率、内存使用率、线程数量、连接数量等指标数据,并可以查看趋势图
点击左侧菜单【进程监测】,监控有三种方式,如下
提示:刚添加完成进程,PID显示获取中,这是因为agent需要3分钟来同步监控进程信息,之后就会持续监测,所以不用担心,稍等一会即可
1、指定进程的进程ID号,如:8982,此种方式进程重启后进程ID会改变,不太方便
2、指定进程的PID文件路径,有些服务启动后会生成一个pid文件,此文件存贮了进程ID号,如:/run/nginx.pid
3、指定进程启动路径的关键字符串,推荐使用此种方法,如下(1)和(2)分别介绍Linux平台和Windows平台的示例
(1) 如果被监控主机是Linux,使用【进程启动路径的关键字】监控进程说明,比如我们想监控wgcloud的server进程
我们可以看到server进程的CMD是java -server -Xms256m -Xmx512m -jar wgcloud-server-release.jar,我们只需要取进程的CMD其中的一段字符串,
能唯一定位到server进程就可以,比如我们取wgcloud-server-release.jar作为【进程启动路径的关键字】,就可以了,这样进程重启后,我们依然可以监测到进程
(2) 如果被监控主机是Windows,使用【进程启动路径的关键字】监控进程说明,比如我们想监控mysql数据库进程,打开任务管理器,找到进程,然后查看它的【命令行】内容,我们找到关键字mysqld.exe作为【进程启动路径的关键字】,就可以了,如下
MySQL Server 5.7\bin\mysqld.exe也可以作为【进程启动路径的关键字】
MySQL Server 5.7也可以作为【进程启动路径的关键字】
非常灵活,只要进程启动路径中的一段字符串能唯一识别进程就可以
4、进程监测,支持批量添加
5、自动恢复指令,v3.4.6开始,支持进程下线后,自动触发恢复指令或脚本,agent会在检测到进程下线后自动执行用户输入的指令,自动恢复指令视频讲解
提示:有时候如果有防火墙或安全软件拦截,导致保存不了恢复指令,可以请负责安全的同事暂时解除下限制
6、进程监控视频讲解
7、如果是agent部署在windows,建议用管理员身份启动agent,否则有可能监控不到进程信息
8、如果监控主机下线了,那么此主机监控的所有进程也会显示下线状态,直到监控主机恢复上线,监控的进程才会恢复在线