本文讨论了在使用或维护InterSystems产品中遇到问题时,试图确定问题时可能用到的思路和工具。
一般故障排除
确定问题发生的地点和时间
- 问题是什么时候开始的?多久发生一次?
- 问题首先出现在哪里?
- 问题在什么条件下会被触发?
审查日志中的警告、错误和警报
以下日志可能包含有关该问题的有用信息。可以尝试在以下日志中寻找问题开始前后的警告或报错。
- 检查 messages.log(IRIS)或者 cconsole.log(Caché and Ensemble)
- 通过文件系统(<install-dir>/mgr/messages.log)访问messages.log文件,或者
- 通过管理门户(系统操作>系统日志>Messages Log)访问文件内容
- 检查production事件日志 (详细信息请参见文档)
- 查看应用程序错误日志 (详细信息请参见文档)
- 查看Web Gateway/CSP Gateway日志
- 查看网络服务器(IIS/Apache)日志
检查实例是否可以访问足够的存储空间
- 检查文件系统剩余空间(推荐设置操作系统层级的存储空间低告警)
- 检查数据库剩余空间
- 通过管理门户(系统操作>数据库>Freespace View)查看数据库文件内剩余空间百分比
- 检查Journal日志空间
检查CPU活动
- 服务器的负载是否在正常范围内?
- 监控CPU利用率
- CPU使用率是稳定的,还是有尖峰?这些尖峰是活动的增加还是减少?
- CPU是否经常在I/O上等待?
- 在安装了sysstat的系统上,可以通过iostat监控此项。
审查开放的事务和锁
- 是否存在开放事务的问题?
- 评估锁表大小。
- 查看messages log中是否有锁表满 LOCK TABLE FULL 的警告
检查所有进程是否按预期运行
- 监控总进程。
- 进程数是否有显著增加?
- 是否有任何进程被卡住,或在循环?
- 进程使用的内存量是否正常?
- 进入管理门户 > 系统操作 > 进程 > 进程ID的详细信息,以获得关于具体进程的信息。
检查镜像监视器和镜像状态监视器
- 监控镜像的状态。同步日志工作是否已经完成?
- 进入管理门户>系统操作>镜像监视器,查看镜像状态。
- 记录镜像成员之间的差异。
- 不是所有在主机上的更改都会通过镜像机制同步到备机。系统管理员需要对主备机上无法自动同步的更改进行手动更改,以及对主备机上不同步的部分做完整的记录。
确保InterSystems IRIS的许可证是有效的
- 监控许可证使用情况。
- 进入管理门户>系统操作>软件许可使用情况查看。
- 监控许可证的过期时间。
联系WRC
你所掌握的关于问题的任何信息都可以帮助WRC确定导致该问题的原因。以下是你可以执行的步骤,以向WRC提供尽可能多的信息。
总结问题
- 这个问题可以重现吗?它是否持续发生?
- 最近系统上是否有任何变化,可能导致了这个问题?
记录InterSystems IRIS和其操作系统的版本信息
- 进入管理门户>关于页面,获取完整的版本信息。
运行监控工具
- 运行系统诊断报告
- IRIS: do ^SystemCheck
- Caché/Ensemble: do ^Buttons
- 如果系统处于挂起状态,运行IRISHung
- IRISHung脚本是一个操作系统工具,用于在InterSystems IRIS实例挂起时收集系统的数据。
- 该脚本位于install-dir\bin目录下,在Microsoft Windows 系统上名称为IRISHung.cmd,在UNIX®/Linux 系统上名称为 IRISHung.sh。
- IRISHung脚本应以管理员权限运行。
- 如果有性能问题,运行系统性能报告
- IRIS: do ^SystemPerformance
- Caché/Ensemble: do ^pButtons
与WRC取得联系
- 访问InterSystems全球响应中心(WRC)网站 (wrc.intersystems.com),或
- 邮件发送问题描述至support@intersystems.com,或
- 拨打中国区技术支持中心热线电话 400-601-9890