DANAは、デジタルウォレットおよび決済サービスを提供しています。2018年のサービス開始以来、急速に成長しており、同社の発表によれば2024年時点でユーザー数は2億人に迫る規模に達しています。送金、チャージ、カード連携、スキャン決済など、幅広い機能を提供しています。
大規模な決済サービスを提供する事業において、データベースは単なるインフラではなく、ビジネスの信頼を支える中核です。ユーザーや加盟店は、大規模キャンペーンや予期せぬトラフィックの急増時でも、決済システムが常に稼働し、データの一貫性が保たれ、万が一の際にも迅速かつ確実に復旧できることを求めています。
課題とニーズ
ユーザー数の拡大と取引量の急増に伴い、DANAが当初採用していたMySQL互換のアーキテクチャでは、フィンテック事業特有の高負荷に十分対応できなくなっていました。
- スケーラビリティの限界。取引のピーク時にはシステムがキャパシティの上限に達し、急激なトラフィックの増加や予測困難な負荷に対応しきれませんでした。初期の小規模クラスタではネイティブなスケールアウトが困難で、事業の急成長を支えるには不十分でした。
- データ一貫性のリスク。MySQL系で一般的な非同期レプリケーションでは、HA(高可用性)構成で障害が発生した際に、確実なフェイルオーバーとデータ整合性を保証することが難しく、金融事業者として大きなリスクを抱えていました。
- 運用の複雑化。オンプレミスからハイブリッドクラウドへの移行に伴い、移行プロセスの管理と日々の安定運用・効率化の両立が大きな課題となっていました。
「当初、DANAはMySQL互換のデータベースを利用していましたが、オンライン取引や加盟店の急増により、取引管理、決済、会計、会員管理、マーケティングなど各システムを支える既存データベースでは、ピーク時の柔軟なスケーリングが難しく、しばしば限界に達していました。そのため、より堅牢で拡張性の高いデータベースへの移行が必要となったのです。」
Zikry Zakiyulfuadi
DANA最高技術責任者(CTO)
OceanBaseが選べれる理由
DANAが求めたのは、高い信頼性とシームレスなスケーラビリティでした。ミッションクリティカルな環境での実績と独自アーキテクチャの強みから、OceanBaseがDANAに採用されました。
障害発生時でもデータの整合性を保持
従来のMySQL型アーキテクチャでは、非同期レプリケーションによる高可用性(HA)切り替え時にリスクが残ります。しかし決済事業では、すべての取引が正確に計上・照合されることが不可欠です。OceanBaseの分散設計はレプリカ間で強整合性を保ち、非同期レプリケーション由来のデータリスクを最小限に抑えます。
アクティブ・アクティブ構成で安定したスループット
OceanBaseは、ワークロードを複数のノードに分散できるアクティブ・アクティブのクラスタをサポートします。これにより、リソース効率とパフォーマンスの安定、可用性の向上を同時に実現します。
業務を止めずにスケールアウト
DANAの成長には、通常運用のまま水平スケールできるデータベースが不可欠でした。OceanBaseの分散アーキテクチャにより、小規模な処理から、秒間数千件のトランザクション処理にまでシームレスに拡張できます。
ハイブリッドクラウドへの現実的な道筋
DANAが目指したのはハイブリッドアーキテクチャです。定常ワークロードはローカルデータセンターで効率的に処理し、トラフィックのスパイクや障害時にはクラウドの柔軟性を活用します。
OceanBaseは、レプリカをローカルデータセンターとパブリッククラウドに分散配置しながらも、データ整合性と高可用性を維持することが可能です。さらに、OceanBase Migration Service (OMS) を活用することで、数百のMySQLインスタンスを本番環境に影響を与えず安全かつ迅速に移行しました。その結果、移行リスクを最小化しつつ、新環境への展開を大幅に加速させました。
戦略的パートナーシップとサポート
OceanBaseは24時間365日のグローバルサポートを提供し、緊急時にはエンジニアがDANAの「War room」に参加。迅速な対応により、DANAの急成長目標達成を力強く支えました。
ソリューションアーキテクチャ
本ソリューションの核となるのは、OceanBaseの「3レプリカアーキテクチャ(データを3か所に冗長化する構成)」を戦略的に導入し、レジリエントかつ高可用性を備えたハイブリッドクラウド基盤を構築した点です。
- 地理的冗長性によるハイブリッドレジリエンス。オンプレミス環境とクラウド環境にレプリカを分散配置することで、耐障害性と災害復旧の選択肢を強化。さらに、通常運用時にはローカル性能を維持し、高い可用性を確保しています。
- 高速復旧と高可用性の両立。DANAでは、OceanBaseをアクティブ・アクティブ構成で実運用に導入。待機状態のスタンバイノードを設けずにノード間で負荷を分散することで、リソースを効率的に活用しつつ、RTO(目標復旧時間)8秒未満という高い復旧性能を実現しています。
- ゼロダウンタイムでの柔軟な拡張。OceanBaseの水平スケーリング機能を活かし、システムを停止することなく、3ノード(1-1-1構成)から6ノード(2-2-2構成)へクラスタをシームレスに拡張。需要の増加に応じて、キャパシティとパフォーマンスを柔軟に向上させることが可能です。
(※ 括弧内は各ゾーンにおけるノード配置数を表します)
移行と展開
DANAにおけるOceanBaseの展開は、稼働中のプラットフォームに影響を与えないよう、リスクを最小限に抑えた段階的アプローチで進められました。
フェーズ1 初期導入(2018年)
2018年にオンプレミス環境でOceanBaseを導入し、迫りつつあった性能上のボトルネックを解消。将来的な成長にも対応可能な、スケーラブルな基盤を構築しました。
フェーズ2 — ハイブリッドクラウド移行(2019年)
2019年にはハイブリッドクラウド構成へ移行し、トラフィックの急増時にも柔軟に対応できる体制と、高い障害耐性を実現。DANAの経営層は、100%オンプレミスや100%パブリッククラウドに偏るのではなく、コスト効率とピーク時の処理能力を両立できるハイブリッド構成が最適解であると判断しました。
フェーズ3 — OMSによる大規模移行の実現
ハイブリッド構成を完成させるため、移行ツール「OceanBase Migration Service(OMS)」を活用し、数百に及ぶMySQLインスタンスをパブリッククラウド上のOceanBaseへ移行。決済、請求、会員管理など複数のシステムにまたがる複雑な移行を円滑に進め、目標とするアーキテクチャの実現を加速させました。
DANAは、OceanBaseチームとの密な協業が成功の鍵であったと語ります。特に、重要な移行フェーズやインシデント対応におけるサポートは、不可欠なものでした。
導入効果
OceanBaseの導入により、DANAはスケーラビリティの制約から解放され、安定した運用のもとで持続的な成長が可能となりました。信頼性、レジリエンス、運用効率の各面で大きな改善が確認されています。
- 本番環境における高い信頼性。2019年のハイブリッドクラウド展開からわずか1年で重要なマイルストーンを達成。2020年にはデータベース起因の障害ゼロ、データ損失ゼロを記録し、システム全体の可用性は99.99%以上という高水準を維持しています。
- 限界のないスケーラビリティ。レガシーなMySQL環境を刷新したことで、ビジネス成長のボトルネックとなっていたデータベースのキャパシティ問題が解消。現在、OceanBaseは高い同時実行トラフィックを安定して処理し、2億人規模のユーザー基盤と数千万のアクティブユーザーを支えています。
- 将来を見据えた災害対策(DR)の強化。可用性向上の一環として、DANAは現在パブリッククラウド上に第3のデータセンターを構築中です。この3拠点構成とハイブリッド戦略により、災害復旧体制が大幅に強化されることが期待されています。
- 内製化による運用体制の確立。技術導入だけでなく、中長期的な自社運用能力の向上にも注力。座学とハンズオンを組み合わせた体系的なトレーニングにより、OceanBase専任のDBAチームを社内で育成しました。これにより、障害対応の迅速化や日常メンテナンスの効率化、運用の自律化が可能になっています。