中间件系统
监控范围:Weblogic\Websphere\JBOSS\MT\MQ\TUXEDO监控方式:SNMP\AGENT\HTTP\JMX监控说明:SNMP式监控为企业IT系统管理服务器系统定期主动轮训方式 ,AGENT和JMX监控的指标更丰富,支持对中间件简单操作。
注:AGENT程序是经过严格测试,对目标系统源占用很少,也可限定对内存的占用大小,不会影响目标系统常运行。
指标分析:(个例仅供参考)
Weblogic
监控项 | 指标名 | 描述 | 报警范围与报警方式 |
整体监控 | AppEventErrCount | 监控应用事件错误 | 一般报警:1-5严重报警:6-10 |
AppSvcAvgElapsedTime | 监控所有应用服务平均消耗时间 | 一般报警:4000-6000严重报警:6000-8000 | |
LongestEJBAvgRespTime | 监控应用的最大的EJB平均响应时间 | 一般报警:4000-6000ms严重报警:6000-8000 | |
Dead消息监控 | NumTotalDeadMsg | 监控所有通道的不可达消息 | 一般报警:1 |
SQL监控 | AvgResponseTime | 执行的所有SQL的平均响应时间 | 一般报警:4000-6000ms严重报警:6000-8000 |
LongestSQLAvgRespTime | 运行SQL的平均最慢的响应时间 | 一般报警:4000-6000ms严重报警:6000-8000 | |
LongestSQLTotalRespTime | 运行SQL的总的最慢响应时间 | 一般报警:8000-10000严重报警:10000-16000 | |
监控Bean Pool | BeanAccessCount | 监控试图从free pool中获取bean的总次数 | 通知:0-100 |
BeanMissCount | 监控试图从free pool中获取bean的失败的总次数 | 一般报警:0-100 | |
CacheMissRatio | 监控BeanMissCount对CacheAccessCount的百分比 | 一般报警:0-100% | |
EJB监控 | LongestEJBAvgRespTime | 监控针对特定EJB执行的任何method的最长的平均响应时间 | 一般报警:800-900ms严重报警:900-1000 |
服务器可用性 | AvailableConnections | 监控JDBC连接池中可用的连接数 | 严重报警:0 |
HealthStatus | 监控JMS service状态 | 严重报警:1-3 | |
ClusteredServerStatus | 监控clustered server的可用性 | 严重报警:0 | |
Heap监控 | FreeHeap | 分配的JVM heap space当前可用的百分比 | 一般报警:5-10严重报警:0-5 |
HeapUsed | 监控Java heap space当前使用的百分比 | 一般报警: 90% ~ 95%严重报警: 95% ~ 100% | |
性能 | AvgConnTime | 监控从客户端通过Weblogic Server连接应用的平均连接时间 | 一般报警:9500-9999ms严重报警:9999-10000 |
ExecutionTimeAverage | 监控servlet的平均执行时间 | 一般报警:800-900ms严重报警:900-1000 | |
报告 | JNDI Naming | 报告JNDI列表 | 文本显示 |
License information | 报告许可证信息 | 文本显示 | |
JTA Information | 报告JTA信息 | 文本显示 | |
Server Performance | 报告Server性能信息 | 文本显示 | |
Server Configuration | 报告Server配置信息 | 文本显示 | |
Server Connections | 报告Server连接信息 | 文本显示 | |
JMS Server Components | 报告JMS Server组件 | 文本显示 | |
Weblogic MBean Information | 报告MBean信息 | 文本显示 |
WEBsphere
监控类别 | 重要程度 | 监控指标名称 | 描述 | 阈值设置 |
系统信息 | 低 | 服务启动后CPU使用率 | Was所驻留的主机平台的指标 | |
系统信息 | 低 | 上次测量CPU使用率 | Was所驻留的主机平台的指标 | |
系统信息 | 低 | 空闲内存 | Was所驻留的主机平台的指标 | |
事务 | 高 | 本地事务提交百分比 | 提交的本地事务占全部本地事务的百分比 | |
事务 | 高 | 全局事务提交百分比 | 提交的全局事务占全部全局事务的百分比 | |
事务 | 高 | 本地事务持续时间 | 事务时间,反映系统的性能 | |
事务 | 高 | 全局事务持续时间 | 事务时间,反映系统的性能 | |
虚拟机 | 高 | 内存使用百分比 | 反映Was运行最基本和关键的指标,如果百分比过高,需调高Jvm参数 | 大于80发告警警告,大于90发严重警告 |
JDBC连接池 | 高 | 使用连接的平均时间 | 根据系统的实际使用情况,设定阈值 |