パフォーマンス監視はobshell Dashboardのコアモジュールの一つであり、OceanBaseクラスタのクラスタレベル、ホストレベル、テナントレベル、OBServerレベル、Unitレベルなど、多様なリソースに対する多次元のパフォーマンス指標をリアルタイムで監視する機能を提供します。これにより、パフォーマンスボトルネックを迅速に特定し、システムリソースの使用状況を最適化することができます。
OceanBaseクラスタ
OceanBaseクラスタは、データベースパフォーマンスとホストパフォーマンスの2つのページに分かれており、クラスタ、ホスト、テナント、OBServer、Unitの5つのレベルのデータを表示します。デフォルトではデータベースパフォーマンスのクラスタレベルで表示され、レベルによって確認できる監視指標が異なります。
ページ |
モニタリング項目 |
|---|---|
| データベース性能 | データベース性能は、クラスター、テナント、OBServer、ユニットの4つの観点から分類され、それぞれ異なる時間帯におけるクラスターとテナントのQPS、SQL応答時間、TPS、トランザクション応答時間、セッション数、リクエスト待ち行列時間、トランザクションログ数、トランザクションログ量、トランザクションログ時間、物理I/O回数、物理I/O時間、物理I/Oスループット、トランザクション数といった複数のパフォーマンス指標のグラフ変化を示します。 |
| ホスト性能 | ホスト性能は、クラスターとホストの2つの観点から分類され、それぞれ Linuxシステム負荷、CPU利用率、メモリ、メモリ使用率、IOPS、I/O時間、I/Oスループット、ネットワークスループットといった複数のパフォーマンス指標のグラフ変化を示します。 |
以下では、データベースパフォーマンスのクラスタレベルを例に操作手順を説明します。
手順
obshell Dashboardにログインします。
左側のナビゲーションバーで パフォーマンス監視 をクリックします。
説明
Prometheusのアドレス、ユーザー名、パスワードは初回ログイン時のみ入力する必要があります。まだデプロイしていない場合は、obdを使用したデプロイが推奨されます。
システムはデフォルトでOceanBaseクラスタの データベースパフォーマンス タブに移動します。
データフィルタリング エリアで、監視データのフィルタリング条件を設定します。
絞り込み条件説明リフレッシュ パフォーマンスデータの リフレッシュ頻度 を更新する必要があります。オフ ボタンにカーソルを合わせると表示されるドロップダウンリストからリフレッシュ頻度を選択できます。リフレッシュ頻度のオプションは Off、5s、10s、30sで、デフォルトはOffです。また、いつでも リフレッシュ ボタンをクリックしてリアルタイムで更新することもできます。表示時間間隔 カスタマイズ可能です。 - 左側をクリックすると、現在時刻から最も近い期間の監視情報を選択できます。例えば、
過去30分をクリックすると、現在時刻から30分以内の監視情報が表示されます。デフォルトでは過去1時間のデータが表示されますが、必要に応じて選択できます。 - 右側には日付と時間が表示されています。日付は手動入力または下部のカレンダーから選択でき、時間も手動入力またはマウスでスライドして選択できます。
Zone デフォルトではすべての Zone のパフォーマンスデータが表示されます。Zone フィールド後のオプションをクリックすると、対応する Zone のパフォーマンスデータを表示できます。 OBServer デフォルトではすべての OBServerノードのパフォーマンスデータが表示されます。OBServer フィールド後のオプションをクリックすると、他の OBServerノードのパフォーマンスデータを表示できます。 - 左側をクリックすると、現在時刻から最も近い期間の監視情報を選択できます。例えば、
データベースパフォーマンス タブは、クラスタ、テナント、OBServer、Unitの4つの次元におけるデータベースパフォーマンス監視データを表示します。それぞれの時間帯における各次元の QPS、SQL応答時間、TPS、トランザクション応答時間、セッション数、リクエスト待ち行列時間、トランザクションログ数、トランザクションログ量、トランザクションログ時間、物理I/O回数、物理I/O時間、物理I/Oスループット、トランザクション数 の複数のパフォーマンス指標のグラフの変化を示します。
以下の機能を利用すると、トレンドグラフでのパフォーマンス監視データの表示と分析がより容易になります。画像と以下の説明を組み合わせてご理解ください。
クエスチョンマークアイコンにカーソルを合わせると、対応する監視項目の説明を見ることができます。監視グラフの任意の位置にカーソルを合わせると、折れ線グラフの詳細情報を見ることができます。右上の▲と▼をクリックすると、前後のページに移動できます。
特定の監視項目に対して操作を行うことができます。例えば、下図の赤枠部分をクリックすると、その線の情報が表示されなくなります。青枠部分をクリックすると、その1本の線の情報のみが表示されます。
OceanBaseテナント
obshell Dashboardでは、テナント次元とUnit次元から、OceanBaseテナント内のパフォーマンスおよびSQL、トランザクション、ストレージとキャッシュの3つの側面の監視データを確認できます。以下の2つの方法で確認できます:
方法1:obshell Dashboardにログインし、左側のナビゲーションバーで テナント管理 をクリックします。テナント管理 ページのテナントリストで該当するテナントをクリックし、そのテナントの管理ページに移動します。左側のナビゲーションバーで パフォーマンス監視 をクリックすると、システムはデフォルトで パフォーマンスとSQL タブに移動します。
方法2:obshell Dashboardにログインし、左側のナビゲーションバーで パフォーマンス監視 をクリックします。OceanBaseクラスタ タブに移動し、上部の OceanBaseテナント をクリックすると、パフォーマンスとSQL タブに移動します。
説明
方法1、すなわち テナント管理 ページから パフォーマンス監視 ページに入る場合、現在のテナントの監視情報のみを確認できます。
OceanBaseテナントページは、テナント次元とUnit次元から パフォーマンスとSQL、トランザクション、ストレージとキャッシュ の3つの次元のパフォーマンスデータを表示します。デフォルトではパフォーマンスとSQLのテナント次元データが表示されます。異なる次元では、確認できる監視指標が異なります。
ページ |
モニタリング項目 |
|---|---|
| パフォーマンスとSQL | QPS、応答時間、SQL実行計画の種類、SQL実行時間、セッション数、待機時間、待機イベントの時間、リクエスト待機キュー、リクエスト待機キューの時間、テナントCPU消費、テナントスレッド利用率、メモリ使用率、MEMStore使用率、RPCパケット時間、RPCパケットスループット、オープンカーソル数、RPCリクエスト成功率、GTSリクエスト数、RPCネットワーク遅延、RPCデリバリ失敗 の各パフォーマンス指標のグラフの変化を表示します。 |
| トランザクション | TPS、トランザクション応答時間、トランザクション応答時間詳細、トランザクションロールバック比率、トランザクションログ数、トランザクションログ量、トランザクションログ時間、トランザクションロック待機回数、トランザクションロック平均待機時間、トランザクション数、Memstoreロック申請成功率 の各パフォーマンス指標のグラフの変化を表示します。 |
| ストレージとキャッシュ | MEMStore、物理I/O回数、物理I/O時間、物理I/Oスループット、キャッシュサイズ、キャッシュヒット率、キャッシュリクエスト回数、ログディスク、ログディスク割合、Vectorメモリ、Vectorメモリ割合 の各パフォーマンス指標の性能変化を表示します。 |
以下では、方法2 の パフォーマンスとSQL タブを例に、具体的な操作手順を紹介します。
手順
obshell Dashboardにログインします。
左側のナビゲーションバーでパフォーマンス監視を選択すると、システムはOceanBaseクラスタタブに移動します。
OceanBaseテナントタブを選択します。
データフィルタリングエリアで、監視データのフィルタリング条件を設定します。
絞り込み条件説明リフレッシュ パフォーマンスデータの リフレッシュ頻度 を更新する必要があります。オフ ボタンにカーソルを合わせると表示されるドロップダウンリストからリフレッシュ頻度を選択できます。リフレッシュ頻度のオプションは Off、5s、10s、30sで、デフォルトはOffです。また、いつでも リフレッシュ ボタンをクリックしてリアルタイムで更新することもできます。表示時間間隔 カスタマイズ可能です。 - 左側をクリックすると、現在時刻から最も近い期間内の監視情報を選択できます。例えば、
過去30分をクリックすると、現在時刻の30分前からの監視情報が表示されます。デフォルトでは過去1時間のデータが表示されますが、必要に応じて選択できます。 - 右側には日付と時刻が表示されています。日付は手動入力または下部のカレンダーから選択でき、時刻も手動入力またはマウスでスライドして選択できます。
テナント デフォルトでは sys テナントのパフォーマンスデータが表示されます。テナント フィールド後ろのオプションをクリックすると、他のテナントのパフォーマンスデータを表示できます。 Zone デフォルトではすべての Zone のパフォーマンスデータが表示されます。Zone フィールド後ろのオプションをクリックすると、対応する Zone のパフォーマンスデータを表示できます。 OBServer デフォルトではすべての OBServer ノードのパフォーマンスデータが表示されます。OBServer フィールド後ろのオプションをクリックすると、他の OBServer ノードのパフォーマンスデータを表示できます。 - 左側をクリックすると、現在時刻から最も近い期間内の監視情報を選択できます。例えば、
デフォルトでは、パフォーマンスとSQLタブのテナント次元が表示され、QPS、応答時間、SQL実行計画カテゴリ、SQL実行時間、セッション数、待機時間、待機イベント時間、リクエスト待機キュー、リクエスト待機キュー時間、テナントCPU消費、テナントスレッド利用率、メモリ使用率、MEMStore使用率、RPCパケット時間、RPCパケットスループット、オープンカーソル数、RPCリクエスト成功率、GTSリクエスト数、RPCネットワーク遅延、RPC配信失敗など、複数のパフォーマンス指標のグラフの変化が表示されます。
以下の機能を利用すると、トレンドグラフでのパフォーマンス監視データの表示と分析がより容易になります。画像と以下の説明を組み合わせてご理解ください。
クエスチョンマークアイコンにカーソルを合わせると、対応する監視項目の紹介を見ることができます。監視グラフの任意の位置にカーソルを合わせると、折れ線グラフの詳細情報を見ることができます。右上の▲と▼をクリックすると、前後のページに移動できます。
特定の監視項目に対して操作を行うことができます。例えば、下図の赤い枠の部分をクリックすると、その線の情報が表示されなくなります。下図の青い枠の部分をクリックすると、その1本の線の情報のみが表示されます。