このセクションでは、ノードのダウン、ネットワークジッター、obproxyの障害以外に考えられるその他のハードウェアおよびネットワーク関連の異常問題について説明し、それぞれの緊急対応策を提案します。
緊急時の対処方法
一般的なノードのダウン、ネットワークジッター、obproxyの障害に加えて、ディスクI/O異常、ディスクの損傷、NIC異常、ノードのCPU/メモリ異常など、他にもさまざまなハードウェア異常があります。これらのハードウェア異常は通常、RTの増加やトランザクションのコミット不能などの影響を引き起こします。
不明なハードウェア問題が疑われる場合は、まずstop serverを実行することができます。stop serverは損失のない安全な操作であり、最初の段階で障害を隔離するための最も効果的な手段です。ただし、この操作はクライアントが該当ノードにアクセスした際にエラーを返すため、状況が許せば、まずisolate server操作を実行してください。具体的な例は以下のとおりです:
ALTER SYSTEM ISOLATE SERVER 'xxx.xxx.xxx.xxx:2882';
ALTER SYSTEM STOP SERVER 'xxx.xxx.xxx.xxx:2882';
ハードウェア異常が原因であることが明確なデータベースの問題については、障害が発生したマシンを直接交換するだけで済みます。