文章
· 十二月 15, 2022 阅读大约需 3 分钟

第十四章 使用系统监视器 - 跟踪系统监视器通知

第十四章 使用系统监视器 - 跟踪系统监视器通知

通常,应调查任何系统监视器警报(严重性 2 的通知)或系统监视器警告序列(严重性 1)。 Health Monitor 还可以生成系统监视器警报和警告。

系统监视器警报、警告和状态消息(严重性 0)被写入消息日志 (install-dir\mgr\messages.log)。 (所有系统监视器和健康监视器状态消息都写入系统监视器日志,install-dir\mgr\SystemMonitor.log。应用程序监视器警报不会写入日志,但可以通过电子邮件发送或传递给指定的通知方法。 )

要跟踪系统监视器警报和警告,可以执行以下操作:

  • 使用 ^%SYSMONMGR 实用程序查看系统监视器警报。此选项允许显示所有传感器或特定传感器的警报,并查看所有记录的警报或仅查看在指定时间段内发生的警报,但它不显示警告。
  • 监控消息日志。请记住,当在短时间内为给定传感器生成一系列系统监视器警报时,只有第一个会写入消息日志。

注意:在消息日志中,System Monitor 状态通知以首字母大写标记,例如 [System Monitor]%SYS 开头,而 warningsalertsOK 消息则以大写标记,例如 [SYSTEM MONITOR] CPUusage Warning: CPUusage = 90(警告值为 85)。

配置 Log Monitor 以发送消息日志中出现的警报(和可选警告)的电子邮件通知(而不是将它们写入警报日志,这是默认设置)。当依赖此方法时,请记住日志监视器不会为配置严重性的每个消息日志条目生成通知;当在大约一个小时内有来自给定进程(例如系统监视器)的一系列条目时,仅针对第一个条目生成通知。例如,如果网络问题导致在 15 分钟内生成多个有关 ECP 连接和打开事务的系统监视器警报,则日志监视器仅生成一个通知(针对第一个警报)。因此,在从日志监视器收到单个系统监视器通知后,应该立即查看系统监视器警报并查阅消息日志。

系统监视器状态和资源指标

下表列出了系统监视器采样的系统状态和资源使用指标,以及导致警告(严重性 1)、警报(严重性 2)和“状态正常”(严重性 0)通知的每个通知阈值和规则。

Metric Description Notification Rules
Disk Space 数据库目录中的可用空间 < 250MB — warning
< 50MB — alert
> 250MB (after warning/alert) — OK
Journal Space 日志目录中的可用空间 < 250MB — warning
< 50MB — alert
> 250MB (after warning/alert) — OK
Paging 已用物理内存和分页空间的百分比 paging space > 30% — warning
(physical memory > 96%) + (paging space > 50%) — alert
Lock Table 正在使用的锁表的百分比 > 85% — warning
> 95% — alert
< 85% after warning/alert — OK
write daemon 写守护进程的状态 写入守护进程处于唤醒状态并正在处理其(非空)队列,但在一个周期中的运行时间比配置的写入守护进程周期时间(默认 80 秒)长至少 10 秒 - alert
写入守护进程在警报后完成传递 - OK
ECP Connections 与 ECP 应用程序服务器或 ECP 数据服务器的连接状态 状态至少有五 (5) 秒出现故障 — 警报
Shared Memory Heap (Generic Memory Heap) 共享内存堆(SMH)的状态,也称为通用内存堆(gmheap) SMH (gmheap) status 1 — warning
SMH (gmheap) status 2 — alert
Open Transactions 最长打开本地或远程 (ECP) 事务的持续时间 > 10 minutes — warning
> 20 minutes — alert
License Expiration 许可证到期前的天数 7 days — warning
5 days or fewer — alert (daily)
SSL/TLS Certificate Expiration 证书过期前的天数 个人证书将在 30 天内到期 - 警告(每天重复)
一个或多个每日过期证书警告 - 警报(警告摘要,每天一个)
ISCAgent (mirror members only) ISCAgent status 无响应 无反应超过 1 分钟 — 警报
讨论 (0)1
登录或注册以继续