记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)

概要

现场服务器告警灯亮,其他服务器正常,磁盘灯正常,所以从整体来看应是内部部件抛出的异常问题,需要登录机器确认:
在这里插入图片描述

调查流程

通过ILOM web界面查看服务器状态进行信息收集:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
以上内容,可以看到报错是/SYS/MB/P0,并且服务器重启过一次。报CPU的问题,貌似比较严重,验证当前CPU情况同步查询相应官方文档。
磁盘服务状态正常:
在这里插入图片描述
CPU 64输出没问题:
在这里插入图片描述
在这里插入图片描述
官方文档:
在这里插入图片描述
严重程度是危急的,通过ilom命令行确定损坏部件状态:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
PCIE7应该是cpu0的插槽(PCle Slot 7)

处理方式:

以上确定我系统是在正常运行情况下,并且输出cpu正常,判断为临时性错误,或ilom监测异常导致,尝试清掉报错。
在这里插入图片描述

ssh -l root <ilom ipaddr>

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
依次将/SYS/MB/P0和/SYS完成清除,进行确认

start /SYS/faultmgmt/shell

fmadm faulty -a

在这里插入图片描述
通过ilom web再次确认状态:
在这里插入图片描述

最近更新

  1. TCP协议是安全的吗?

    2023-12-15 05:46:04       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-15 05:46:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-15 05:46:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-15 05:46:04       18 阅读

热门阅读

  1. 使用pyinstaller将python代码打包成exe文件

    2023-12-15 05:46:04       48 阅读
  2. ReactHooks大全—useState

    2023-12-15 05:46:04       48 阅读
  3. ES常见查询总结

    2023-12-15 05:46:04       34 阅读
  4. 如何使用EXCEL制作一份高效、美观的成绩单

    2023-12-15 05:46:04       39 阅读
  5. MySQL和Minio数据备份

    2023-12-15 05:46:04       39 阅读
  6. REST与RPC = 面向对象和函数编程

    2023-12-15 05:46:04       38 阅读
  7. Vue3 逻辑复用 - 组合式函数

    2023-12-15 05:46:04       38 阅读