このセクションでは、ノードのダウン、ネットワークジッター、OBProxyの障害以外の、その他の可能性のあるハードウェアおよびネットワーク関連の異常問題について説明し、対応する緊急対処策を提案します。
緊急対処方法
ハードウェア異常には、一般的なノードのダウン、ネットワークジッター、OBProxyの障害以外にも、ディスクI/O異常、ディスク障害、NIC異常、ノードCPU/メモリ異常などがあります。これらのハードウェア異常は通常、RTの増加やトランザクションのコミット不能などの影響を引き起こします。
不明なハードウェア問題が疑われる場合は、まずstop serverを実行できます。stop serverは無損失の安全な操作であり、最初の段階で障害を隔離するための最も効果的な手段です。ただし、この操作はクライアントがそのノードにアクセスする際にエラーが発生するため、シナリオが許す場合は、まずisolate server操作を実行してください。具体的な例は以下のとおりです:
ALTER SYSTEM ISOLATE SERVER 'xxx.xxx.xxx.xxx:2882';
ALTER SYSTEM STOP SERVER 'xxx.xxx.xxx.xxx:2882';
ハードウェア異常が原因でデータベースに問題が発生している場合は、障害が発生したマシンを直接交換するだけで済みます。