概要

OceanBaseはシェアードナッシングのMPPアーキテクチャを採用し、行・列ストレージエンジン、ベクトル化エンジン、そして高度なオプティマイザーを備えています。これにより、オンライントランザクション処理とリアルタイム分析を単一のデータベースエンジンで同時に実現し、リソース分離を維持しながら安定したパフォーマンスを提供します。インプレース分析機能により、ETLプロセスが不要になり、データの鮮度を保ちながらリアルタイムのデータウェアハウス構築も不要です。

課題

リアルタイム性が低いオフラインデータウェアハウス

オフラインデータウェアハウスは、多くの場合、データが1日遅れで更新されるため、更新機能も限られており、ビジネスチームのリアルタイム分析やマーケティングのレコメンデーションなどに即時対応することが難しいです。リアルタイムデータウェアハウスを単体で構築するのは非常に複雑で、データ同期リンクのメンテナンスには追加の人的資本が必要になります。

混合ワークロードの分離が不十分

HTAPのコア技術は、1つのエンジンで複数のワークロードをサポートしますが、リソース分離が保証されていない場合、分析やバッチ処理がトランザクションデータベースに影響を与え、オンライントランザクションのパフォーマンス低下を引き起こす可能性があります。これにより、ビジネスに深刻なダメージを与える恐れがあります。

膨大なデータ量、ストレージ冗長化にコストがかかる

ビジネスで発生する大量のデータは分析の基盤となりますが、すべてを保存する必要はありません。これらのデータは膨大なストレージ容量を占める一方で、価値密度が低いため、保存コストが高くなりがちです。

データの大量コピー、リソース重複にコストがかかる

業務ごとに求められる技術や機能が異なるため、データが複数のOLAPデータベースに重複して保存され、リソースが過剰に分散されることになります。このように一元化された技術スタックを活用できないため、コストが増加します。

対策

  • OMS(データ移行サービス)を使用して、異種データベースのデータベースとテーブルをシャーディングし、OceanBaseのネイティブなパーティションテーブルに移行・同期します(複数のテーブルを統合して同期)。OceanBaseへの移行により、複数のインスタンスが1つに統合され、ミドルウェアのメンテナンスから解放されるとともに、ストレージのスケーラビリティが大幅に向上します。さらに、OceanBaseのHTAPモードでは、ビジネスにおける分析やクエリをより早く実行でき、T+1のデータを待つことなく、オンラインデータベースでリアルタイムのマーケティング分析が可能になります。

利点

シンプルなアーキテクチャによるコスト削減

一元化されたHTAP機能により、単一のデータベースでトランザクション処理と分析処理の2つのシナリオに対応できます。ビジネスシナリオに合わせて複数のデータベースの技術スタックを何度も構築する必要がないため、技術アーキテクチャを大幅に簡略化しビジネス効率が向上させることができます。

処理効率の向上

次世代のベクトル化エンジン、列指向ストレージエンジン、強力な並列実行エンジン、そしてSQLオプティマイザーを搭載したOceanBaseは、複雑で強力なSQL実行機能を提供し、膨大なデータの高速並列処理と分析を実現します。

異なるワークロード間のリソース分離

OceanBaseは、1つのエンジンでOLTPと基本的なOLAPシナリオを同時に処理します。リソースグループ分離技術に基づき、OLTPとOLAPのビジネスに対して信頼性の高いリソース分離ソリューションを提供します。そのため、複雑なリアルタイムデータウェアハウスの構築は不要です。

マルチモデルのシナリオ対応

OceanBaseは、OracleとMySQL構文互換に加え、HBaseやRedisのAPI、JSON形式の半構造化データもサポートします。強力なCDC機能により、さまざまな下流システムでのデータ消費を容易にします。

リアルタイムデータの更新

リレーショナルデータベースの更新機能をベースに、トランザクションを完全にサポートします。改良されたPaxos整合性プロトコルを使用し、レプリカ間のレイテンシを最小限に抑え、データの同期を実現します。

膨大なオンラインデータを格納

一般的なリレーショナルデータベースが限られたデータ転送/分析能力しか持たないのに対し、OceanBaseのネイティブ分散アーキテクチャは円滑な水平方向の拡張をサポートします。拡張後は線形に増加し、シングルクラスターは最大1000ノード以上、データ容量はPBレベルを超えます。

OceanBaseを使い始める