监控范围:Windows(2K\XP\2003\Vista)
LINUX(Red Hat\SUSE \红旗 \Ubuntu Linux\FreeBSD\Turbo)
UNIX(Solaris 8、9、10)\AIX (4.X、5.1、5.2、5.3)\HP-UX (11i)
监控方式:SNMP\AGENT
监控说明:SNMP方式监控,被管机器上仅需要启动SNMP服务,采集的指标为一些通用指标,AGENT方式监控,需要在被管机器上安装AGENT程序,采集的指标丰富,而且可以根据具体需要进行定制,AGENT监测方式支持对主机的简要操作。
注:AGENT程序是经过严格测试,对目标机器的资源占用很少,也可限定对内存的占用大小,不会影响目标机器的正常运行。
指标分析:
UNIX\LINUX
监控项
|
指标名
|
描述
|
报警范围
|
CPU
|
CPUCpuUtil
|
显示的是CPU使用率
|
一般报警:90% ~ 95%
严重报警:95% ~ 100%
|
CPULoad
|
在采样间隔内,内核中运行队列中排队的进程的平均值
|
需要了解系统的实际情况后而定
|
|
CPUUserTime
|
用户模式下的命令使用的CPU的时间
|
需要了解系统的实际情况后而定
|
|
CPUSysTime
|
系统模式下的系统命令使用的CPU的时间
|
一般报警:90% ~ 95%
严重报警:95% ~ 100%
|
|
文件系统
|
FSCapacity
|
反映了文件系统使用空间的百分比
|
一般报警:96% --- 98%
严重报警:98% ~ 100%
|
FSMountState
|
文件系统挂载状态
|
一般告警:1(unmounted)
严重告警:2(unknown)
|
|
内存
|
MEMFreeMem
|
反映了操作系统中空闲的内存
|
一般报警:100 ---200K
严重报警:0 ---100K
|
MEMRCache
|
缓冲区逻辑读的百分比
|
一般报警:1-10%
严重报警:10-20%
|
|
进程
|
PROCTopProcs
|
显示最占用系统资源的前10个进程
|
文本输出
|
PROCExec
|
每秒钟系统调用次数
|
图形显示
|
|
交换区
|
SWPTotSwapUsedPercent
|
反映的是系统中所有的交换区的使用的空间的数量
|
一般报警:90% ~ 95%
严重报警:95% ~ 100%
|
用户
|
USRNoUser
|
在系统登陆的用户数
|
图形显示
|
UsrNoSession
|
用户session数量
|
图形显示
|
WINDOWS
监控项
|
指标名
|
描述
|
报警范围
|
磁盘
|
Logical Disk Space
|
显示逻辑硬盘剩余空间的百分比
|
一般报警:5% ~ 10%
严重报警:0 ~ 5%
|
CPU
|
CPU
|
在采样间隔内,系统使用CPU的时间
|
一般报警:90% ~ 95%
严重报警:95% ~ 100%
|
内存
|
Memory Available
|
显示内存的可用空间
|
一般报警:4MB ~10M
严重报警:<4MB
|
Memory Page Faults
|
显示每分钟Memory Page Faults的次数
|
一般报警:10~20
严重报警:<10 Page File
|
|
PageFile
|
Page File
|
Page文件使用的百分比
|
一般报警:80% ~90%
严重报警:90% ~ 100%
|
进程
|
ProcTopProcs
|
消耗资源最大的Top10的进程
|
文本显示
|
安全
|
SECsvrErrorsLogon
|
检查从系统启动开始的所有失败的登陆次数
|
图形显示
|
SECsvrErrorsLogonDelta
|
上一轮询周期内的登陆失败次数
|
图形显示
|
|
服务
|
ServiceStatus
|
监控自动启动的服务启动情况
|
严重报警:not running
|