采集主机GPU信息功能,是v3.5.5新增的一个功能模块,所以需要升级到v3.5.5或者以上版本
我们在主机管理的列表页面,点击【查看更多】->【扩展监控】按钮,就可以看到该主机的GPU信息
agent每间隔10分钟就会采集一次主机的GPU数据,采集时间暂不支持修改
如果不想采集主机的GPU信息,也可以在agent配置文件里(config/application.properties)修改如下配置项gatherGpuCmd,改为no,然后重启agent即可
gatherGpuCmd可以自定义,我们想要什么样的数据,就配置为自己实际需要的指令或者脚本,脚本可以用shell或者python
默认指令是获取GPU的使用率,可以修改,修改后重启agent即可
agent只会采集指令执行的结果,不会做处理,直接上报给server进行展现
GPU监控目前没有实现告警能力,只进行采集和展示
注意:gatherGpuCmd配置的值,不能包含敏感字符【rm ,mkfs, /dev/,:(){:|:&};:,mv , install ,del ,delete ,format ,ren ,rd ,rd/s/q ,rmdir 】,否则agent会拒绝执行该指令
提示此功能需要 升级到企业版 才可以使用