Email: service@parnassusdata.com 7 x 24 online support!

    You are here

    • You are here:
    • Home > Blogs > PDSERVICE's blog > Oracle ASM 磁盘组 dismount 显示 “Waited 15 secs for write IO to PST”

Oracle ASM 磁盘组 dismount 显示 “Waited 15 secs for write IO to PST”

Oracle ASM 磁盘组 dismount 显示 “Waited 15 secs for write IO to PST”

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线 : 13764045638 QQ号:47079569 邮箱:service@parnassusdata.com

 

适用于:

Oracle Database – Enterprise Edition – 版本 11.2.0.3 到12.1.0.1 [Release 11.2 to 12.1]
本文信息适用于任何平台。

症状

 

正常或高冗余磁盘组被dismounted ,显示这些警告消息。

//ASM alert.log
Mon Jul 01 09:10:47 2013
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
….
GMON dismounting group 6 at 72 for pid 44, osid 8782162

 

 

原因

通常这类信息在以下情况下出现在ASM 警告日志文件中,

延迟的 ASM PST 在正常或高冗余磁盘组上的ASM磁盘上心跳,
因此ASM实例dismount磁盘组。默认下,它是15秒。

 

顺便说下,对于外部冗余磁盘组,心跳延迟有点被忽略。
ASM 实例停止发出更多PST 心跳直到它成功完成PST 重新验证,
但心跳延迟不直接dismount外部冗余磁盘组。

通过在以下情况中,ASM 磁盘可能无响应:

+    多路径失败的物理路径的其中一些脱机或丢失
+    在一个多路径设置中路径 ‘failover’
+    服务器负载,或任何类型的存储/多路径/OS维护

 

Doc ID 10109915.8 简述了Bug 10109915(该修复引入了这个underscore参数)。且在Hung NFS Server/Filer 的情况中,问题是没有OS/存储可调超时timeout机制的。然后,_asm_hbeatiowait 帮助设置time out。

 

 

解决方案

1]    与OS 和Storage 管理员确认有无磁盘无响应。

2]    尽可能保持磁盘响应在15秒以下。

这取决于多个因素,如
+    操作系统
+    多路径(和多路径类型)的存在
+    任何内核参数

所以你要搞清楚你的设置的磁盘无响应的’maximum’是多少。

例如,在AIX上 rw_timeout 设置影响这一点,且默认为30秒。

另一个例子是原生多路径的Linux。在这样的设置中,物理路径的数量和multipath.conf文件中的POLLING_INTERVAL值将决定这个最大磁盘无响应。

所以对于你的设置(OS / 多路径/ 存储的组合),你需要找到这个。

3]    如果你不能保持磁盘无响应在15秒以下,则可以在ASM实例(在RAC的所有节点上)中设置以下参数:

_asm_hbeatiowait

对于每个内部17274537 ,基于内部尝试,应该将值增加到120秒,这在12.1.0.2中被修复

 

在asm实例中运行以下来设置_asm_hbeatiowait所需的值

alter system set “_asm_hbeatiowait”=<value> scope=spfile sid=’*’;

然后重启asm 实例/ crs,使新参数值生效。