案例:ORA-15096: lost disk write detected

案例背景:4节点extend rac,存储raid 5校验异常,修复之后SOLDATA磁盘组无法mount,报错ORA-15096: lost disk write detected。

mount SOLDATA磁盘组ASM日志:

查看ora-15096的描述,官方提供的action还是比较悲观的。

kfed读取4个thread的acd checkpoint分别为:

  • thread 1(inst_id 2) acdc:
  • thread 2(inst_id 1) acdc:
  • thread 3(inst_id 4) acdc:
  • thread 4(inst_id 3) acdc:

报错的trace可以看到是在做acd前滚recover的时候出现了异常,其实ora-15096错误的原因就是在前滚过程中,ACD block描述的元数据块变更与实际元数据块不一致导致的。

kfed读取recover报错的ACD BLOCK

kfed读取recover报错的元数据block:

明白了来龙去脉之后修复方法有两种:

  • 修改thread 3 acd checkpoint
  • 修改303号文件filedir的fscn
此条目发表在Oracle, Oracle Recover分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注