Script:I/O monitor for last one minute

该脚本作用是从数据库层面监控最近1分钟的I/O情况,包括Iops、Mbps、I/O latency、TOP I/O sql等等。 继续阅读

发表在 Oracle, Script | 标签为 | 留下评论

oracle:Per-Process PGA memory limit

前几日,东区某客户的19c rac出现了ORA-04030,从报错的trace来看,使用了32g的PGA,对于单进程内存上限众说纷纭,有很多不同意见,有些说2g、有些说4g。。。,本篇文章就深入分析一下oracle进程内存上限。

说到PGA不得不关联到UGA和CGA,下面参考个人觉得写得很好的blog,对PGA、UGA、CGA进行了详细的概述。 继续阅读

发表在 Oracle, Oracle troubleshooting | 标签为 , , , | 留下评论

oracle online系列(三):online move table

在12c之前,move table属于一个离线操作,由于TM锁不兼容会阻塞dml操作,并且move之后表上索引会变成unusable,这对于7*24小时的业务场景是不可接受的,如果想实现online move table必须要使用在线重定义来完成。而在线重定义操作步骤还是相对比较繁琐的。 继续阅读

发表在 Oracle | 标签为 | 留下评论

案例:expdp dmp损坏恢复

本案例来自某客户的expdp dmp从服务器上下载下来存档之后,删除了服务器上的dmp,后来需要导入的时候发现导入报错。

看名字应该是每天都会对用户进行expdp导出。对于这类损坏的dmp文件应该如何恢复呢?oracle内部提供了DUL恢复工具,当然DUL的作用并不仅仅是抽取dmp文件,其他功能本文就不介绍了。 继续阅读

发表在 Oracle, Oracle Recover | 标签为 | 留下评论

案例:ORA-00600: internal error code, arguments: [4097]

本案例来自某省电信一套11.2.0.4的rac,应用的存储过程调用一直在报ORA-00600: internal error code, arguments: [4097],对于经常搞恢复的人来说,这个错误非常熟悉,都不用分析直接重建undo即可,但是作为一个专业的troubleshooter,还是多少分析一下来龙去脉吧。。。 继续阅读

发表在 Oracle, Oracle troubleshooting | 标签为 | 留下评论

oracle online系列(二):online indexbuild

online indexbuild (online create或者rebuild index)是oracle的一个非常常用的online操作,我们知道当创建索引或者重建索引没有加online关键字的话,会请求表对象上的4号TM锁,而DML请求的是3号TM锁,3和4的TM锁并不兼容,所以在索引创建或者重建期间是无法进行DML操作的,等待事件为enq: TM – contention。为了改进这一缺陷,在oracle 8i推出了online indexbuild功能,并且在11.1该功能得到了进一步增强。online indexbuild就不会影响其他DML操作的正常运行。本文将深入解析 online indexbuild的工作原理。 继续阅读

发表在 Oracle | 标签为 , , | 留下评论

oracle online系列(一):online move datafile

昨日与维照的技术交流中,说起oracle的诸多online操作,所以决定写一个oracle online操作的系列文章。

先从online move datafile说起,online move datafile是12.1的新特性,在12c之前如果想要move datafile通常需要下列步骤: 继续阅读

发表在 Oracle | 标签为 | 留下评论

案例:ORA-00600: internal error code, arguments: [4187]

本案例客户来自某省电信,alert日志大量的ORA-00600[4187]报错,已经影响到业务正常运行。 继续阅读

发表在 Oracle, Oracle troubleshooting | 标签为 | 留下评论

案例:troubleshooting gc buffer busy acquire(一)

本案例来自两年前深圳某客户两节点rac的一次生产故障,现象是大面积的gc buffer busy acquire导致业务瘫痪。

首先查看1节点awr头部信息和load profile 继续阅读

发表在 Oracle, Oracle troubleshooting | 标签为 , | 留下评论

案例:ohasd crash on aix

本案例是福建某客户一套待上线系统,操作系统版本为AIX 7.2 ,集群版本为12.2。几天前2节点GI突然重启,由于是比较重要的待上线系统,所以需要仔细一下分析原因。 继续阅读

发表在 Oracle, Oracle troubleshooting | 标签为 , | 留下评论